智能网联汽车基于逆强化学习的轨迹规划优化机制研究
作者:彭浩楠; 唐明环; 查奇文; 王聪; 王伟达
加工时间:2023-11-20
信息来源:北京理工大学学报
关键词:智能网联汽车;逆强化学习;轨迹规划;最大熵原则
摘 要:针对当前轨迹规划策略存在实时性差、优化目标权重系数难以标定、模仿学习方法可解释性差等问题,提出了基于最大熵原则的逆强化学习方法,通过学习经验驾驶员驾驶轨迹的内在优化机制,从而规划出符合人类驾驶经验的整体最优的换道专家轨迹,为解决轨迹规划方法的实时性问题和可解释性问题奠定了理论基础.以一般风险场景和高风险场景为应用案例,通过Matlab/Simulink仿真验证了所提逆强化学习方法实现轨迹规划的可行性与有效性.
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取