作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2018, Vol. 44 ›› Issue (7): 20-24,31. doi: 10.19678/j.issn.1000-3428.0050990

所属专题: 智能交通专题

• 智能交通专题 • 上一篇    下一篇

基于强化学习的无人驾驶匝道汇入模型

乔良 a,鲍泓 a,玄祖兴 a,梁军 a,潘峰 b   

  1. 传统的强化学习方法受离散状态空间和离散动作空间的限制,不能很好地应用于匝道汇入场景。为此,构建一种基于强化学习的无人驾驶匝道汇入模型。使用深度Q网络构建强化学习模型,依据该模型将匝道汇入问题纳入强化学习问题的范畴后进行求解。实验结果表明,该模 型可以针对不同的环境车辆速度采取不同的策略,从而提高无人驾驶在匝道汇入场景下的智能化决策水平。
  • 收稿日期:2018-01-28 出版日期:2018-07-15 发布日期:2018-07-15
  • 作者简介:乔良(1991—),男,硕士研究生,主研方向为无人驾驶决策与控制;鲍泓,教授;玄祖兴,副教授;梁军,教授;潘峰,副教授。
  • 基金资助:

    国家自然科学基金“视听觉信息的认知计算”重大研究计划重点支持项目“智能车驾驶脑认知技术、平台与转化研究”(91420202);北京市教委科研计划项目(KM201811417006);英国皇家工程院牛顿基金(UK-CIAPP\324);北京市属高校高水平教师队伍建设支持计划项目 (IDHT20170511)。

Autonomous Driving Ramp Merging Model Based on Reinforcement Learning

QIAO Liang a,BAO Hong a,XUAN Zuxing a,LIANG Jun a,PAN Feng b   

  1. Autonomous Driving Ramp Merging Model Based on Reinforcement Learning
  • Received:2018-01-28 Online:2018-07-15 Published:2018-07-15

摘要:

传统的强化学习方法受离散状态空间和离散动作空间的限制,不能很好地应用于匝道汇入场景。为此,构建一种基于强化学习的无人驾驶匝道汇入模型。使用深度Q网络构建强化学习模型,依据该模型将匝道汇入问题纳入强化学习问题的范畴后进行求解。实验结果表明,该模 型可以针对不同的环境车辆速度采取不同的策略,从而提高无人驾驶在匝道汇入场景下的智能化决策水平。

关键词: 无人驾驶, 决策, 匝道汇入, 强化学习, 深度Q网络

Abstract:

The traditional reinforcement learning method is limited by discrete state space and discrete action space,and can not be applied to ramp merging scene.Therefore,a reinforcement learning based autonomous driving ramp merging model is constructed.The reinforcement learning model is built by deep Q network.The ramp merging problem is incorporated into the category of reinforcement learning problem and solved.Experimental results show that the model can adopt different strategies for different environment vehicle speeds,thus improving the intelligent decision-making level of the autonomous driving in ramp merging scene.

Key words: autonomous driving, decision-making, ramp merging, reinforcement learning, deep Q network

中图分类号: