|






|
利用先验混合策略纳什均衡的贝叶斯方法进行车辆意向预测
论文作者:Giovanni Lucente, Reza Dariani, Julian Schindler,
Michael Ortgiese
|
|
|
未来几年,车辆自动化领域的先进技术将带来混合交通环境,智能网联汽车必须与人类驾驶的车辆进行互动。在这种情况下,有必要建立意向预测模型,以预测未来几秒内交通场景将如何随着车辆的物理状态、可能的机动性以及交通参与者之间的互动而演变。本文提出了一种贝叶斯车辆意图预测方法,利用混合策略纳什均衡(MSNE)形式的博弈论框架作为先验估计,对交通参与者之间的相互影响进行建模。然后根据库尔贝克-莱伯勒分歧计算可能性。博弈被模拟为具有个人偏好的静态非零和多矩阵博弈,这是一种众所周知的战略博弈。为这些博弈寻找
MSNE 属于 PPAD /cap PLS
复杂性类别,具有多项式时间的可操作性。该方法在长期范围(10s)内的模拟中显示出良好的结果,其计算复杂度允许在线应用。
|
|
关键词:车辆意图预测,轨迹预测,贝叶斯方法,混合策略,纳什均衡
本文是德国宇航中心开展的研究,引用词条如下:
Lucente, G., Dariani, R., Schindler, J. et al. A Bayesian
Approach with Prior Mixed Strategy Nash Equilibrium for
Vehicle Intention Prediction. Automot. Innov. 6, 425–437
(2023)
|
|
阅读全文>>
|
|
|






|
高速公路不确定驾驶环境中基于深度强化学习的自动驾驶汽车决策策略
论文作者:Huifan Deng, Youqun Zhao, Qiuwei Wang, Anh-Tu Nguyen
|
|
|
多车道高速公路上的不确定环境,如周围车辆的随机变道操纵,是实现高速公路安全自动驾驶的一大挑战。为了提高驾驶安全性,本文提出了一种具有综合风险评估功能的启发式强化学习决策框架。首先,该框架包括一个用于预测周围车辆轨迹的长短期记忆模型和一个用于估计可能的驾驶风险的未来综合风险评估模型。其次,引入了启发式衰减状态熵深度强化学习算法,以解决强化学习的探索和利用两难问题。最后,该框架还包括一个基于规则的车辆决策模型,用于解决与周围车辆的交互决策问题。所提出的框架在低密度和高密度交通场景中都得到了验证。结果表明,与常见的双深度
Q
网络对决方法和基于规则的方法相比,交通效率和车辆安全性都得到了提高。
|
|
关键词:自动驾驶、决策、不确定驾驶环境、强化学习、多车道交通、综合风险评估
本文是南京航空航天大学赵又群教授团队研究成果,引用词条如下:
Deng, H., Zhao, Y., Wang, Q. et al. Deep Reinforcement
Learning Based Decision-Making Strategy of Autonomous Vehicle
in Highway Uncertain Driving Environments. Automot. Innov. 6,
438–452 (2023)
|
|
阅读全文>>
|
|
|






|
高速公路自动驾驶的匝道并线:
深度强化学习中新安全指标的应用
论文作者:Guofa Li, Weiyan Zhou, Shen Li, Xingda Qu
|
|
|
本文提出了一种基于深度强化学习的改进决策方法,以解决高速公路自动驾驶中匝道并线的难题。该方法引入了一种新的安全指标--并线时间差(TDTM),与经典的碰撞时间(TTC)指标结合使用,用于评估驾驶安全性,帮助并线车辆找到合适的车流间隙,从而提高驾驶安全性。使用深度确定性策略梯度(DDPG)算法对自动驾驶代理进行训练。在策略探索阶段,采用行动屏蔽机制来防止不安全的行动。所提出的
DDPG + TDTM + TTC 解决方案在 SUMO
中不同行驶速度的匝道并线场景中进行了测试,成功率达到
99.96%,且不会对主干道上的交通效率产生显著影响。结果表明,与
DDPG + TTC 和 DDPG 相比,DDPG + TDTM + TTC
的匝道并线成功率更高,达到 99.96%。
|
|
关键词:自动驾驶、匝道并线、深度强化学习、行动屏蔽机制、深度确定性策略梯度(DDPG)
本文是重庆大学李国法教授团队研究成果,引用词条如下:
Li, G., Zhou, W., Lin, S. et al. On-Ramp Merging for Highway
Autonomous Driving: An Application of a New Safety Indicator
in Deep Reinforcement Learning. Automot. Innov. 6, 453–465
(2023)
|
|
阅读全文>>
|
|