基于深度强化学习的机械臂多模混合控制
作者:李家乐; 张建锋; 李彬; 刘天琅; 陈检
加工时间:2024-12-21
信息来源:计算机工程与设计
关键词:深度强化学习;机械臂;双重演员正则化评论家算法(DARC);奖励机制;动态避障;优先经验回放机制;连续动作控制
摘 要:针对基于深度强化学习控制的机械臂动态避障能力不足,在作业过程中存在多任务冲突问题,提出一种基于双重角色和正则化批评者算法(DARC)的多模混合控制方法。将任务分解为多段避障模式,借助人工势场法的斥力引力思想设计奖励函数并分别进行训练;将经过初步训练的多个模式以距离阈值或奖励积累阈值进行切换控制,消除混合控制存在的冲突;结合机械臂单元运动学特点设计具有软体性质的多连杆机械臂平面仿真模型。实验验证所提方法能够有效提升机械臂动态避障能力,避免多任务间的冲突。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取