基于改进深度确定性策略梯度算法的智能装卸机械设备控制方法
作者:龚宇平; 李金瑾; 卿柏元; 潘学华
加工时间:2025-01-16
信息来源:机械与电子
关键词:改进深度确定性策略梯度算法;智能装卸机械设备;运动学模型;控制方法
摘 要:由于机械臂作业环境具有高度的非线性、时变性和不确定性,导致机械臂动态行为较为复杂,传统控制方法在进行控制过程中经常出现关节位置角度误差大、稳定性差的问题,提出基于改进深度确定性策略梯度(DDPG)的控制方法。首先,建立智能装卸机械设备运动学模型;其次,基于DDPG算法建立装卸动作控制模型;再次,利用演员(Actor)网络(策略网络)和评论者(Critic)网络(价值网络)来改进DDPG中的装卸动作控制过程;最后,优化奖励函数,对Actor网络和Critic网络进行训练,实现装卸机械设备控制。实验结果表明,智能装卸机械设备实际运动轨迹与期望轨迹非常重合和接近,关节位置误差始终低于5.0 cm,姿态角误差始终低于1.00°,能够对关节位置和姿态角进行有效控制,所提改进DDPG算法的控制效果较好。
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取