衰减高斯噪声DDPG算法的机械臂轨迹规划
作者:周雨溪; 赵慧; 韩晓峰
加工时间:2025-01-16
信息来源:农业装备与车辆工程
关键词:强化学习;DDPG算法;正态噪声;机械臂;轨迹规划
摘 要:针对农业采摘机械臂的DDPG算法轨迹规任务中,调查了因高斯噪声标准差取值不当导致的强化学习训练失败问题,提出一种衰减正态噪声的DDPG算法,使高斯标准差σ随训练回合数增加而减小;利用Mujoco物理引擎进行多次仿真训练,验证衰减正态噪声相较于传统正态噪声在轨迹规划任务中的优势。结果表明,改进后的算法在完成采摘机械臂的轨迹规划任务时更为有效,成功解决了存在的问题。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取