基于强化学习的自动驾驶汽车换道决策研究
作者:姜文鑫; 吴志周; 许宏鑫; 梁韵逸
加工时间:2025-01-16
信息来源:计算机工程与应用
关键词:自动驾驶;换道决策;强化学习;马尔可夫决策过程
摘 要:换道作为车辆行驶的常见行为之一,操作不当极易引发交通事故。针对自动驾驶汽车的换道决策问题,提出了一种基于强化学习的DDQN(双深度Q网络)模型,该模型通过离散动作空间,结合驾驶舒适性、效率、安全性和换道惩罚四个方面设计奖励函数,以优化换道决策。为验证换道决策模型的性能,基于SUMO和真实高速公路车辆数据集搭建高速公路场景下的仿真模型。对比实验结果表明,DDQN模型在驾驶舒适性、交通效率、任务成功率及车辆平均行程速度方面均优于传统的DQN(深度Q网络)和DuelingDQN(对决深度Q 网络)模型,且换道次数较少。此外,在四种不同交通拥堵场景下的实验结果显示,DDQN模型在不同拥堵情况下均保持了良好的性能,任务成功率均超过75%。研究表明,基于强化学习的DDQN算法能够为自动驾驶汽车提供有效的换道决策支持。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取