行业报告详情 - 行业报告数据库

行业分类

找到报告 1 篇当前为第 1 页共 1 页

基于MRD-DDPG的机械臂避障路径规划方法

作者：付子强; 郑威强; 张立萍; 何丽; 袁亮; 邵明明加工时间：2023-11-20 信息来源：组合机床与自动化加工技术

关键词：深度强化学习;DDPG;奖励函数;机械臂;路径规划
摘要：提出将MRD-DDPG算法应用在机械臂避障路径规划上，解决了DDPG算法在训练过程中学习效率低、样本利用率低的问题。首先，在DDPG算法的基础上，通过改进经验池机制，提出多经验池延迟采样的深度确定性策略梯度(multi-replay buffer delay sampling-deep deterministic policy gradient, MRD-DDPG)算法，有效的缓解了样本利用率低的问题；其次，针对机械臂交互探索过程中奖励稀疏问题，设计了一种适用于避障路径规划的位置奖励函数，有效的提高了智能体的学习效率。实验结果表明，机械臂避障路径规划的平均成功率达97%左右；MRD-DDPG算法相比于DDPG算法的平均成功率提升了88%;机械臂的平均规划时间为0.638 s。
内容：原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取

行业分类

友情链接

联系我们

QQ咨询

电话咨询

微信公众号

感谢访问