关键词:机械臂控制;SAC算法;轨迹规划;强化学习
摘 要:机械臂作为一种常见的自动化设备,关于其控制算法的研究,一直是相关领域的热点。本文结合目前比较热门的人工智能理论,将强化学习方法引入到机械臂控制中,提出一种基于Soft Actor-Critic Algorithms算法的控制策略,以更好地解决三维空间下多轴机械臂的轨迹规划问题。利于CoppeliaSim平台,搭建仿真环境,选择UR5机械臂作为实验对象,进行了多组对比实验。结果表明:基于策略熵最大化的SAC算法,提高了训练样本利用率,保证了学习结果的最优。在用于三维空间中多轴机械臂控制任务时,不仅可以克服传统控制算法存在的模型依赖性高,规划精度低的不足,并且相比一般强化学习算法,具有更快的学习效率和更高的稳定性,轨迹也更为平滑,具有很好的实用价值。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取