关键词:冗余机械臂;轨迹规划;多目标优化;元启发式;灰狼算法;强化学习
摘 要:针对冗余机械臂时间-冲击最优轨迹规划问题,提出一种基于改进灰狼算法的最优轨迹规划器.首先,为了克服灰狼算法(GWO)开发和探索不平衡的局限性,提出基于强化学习的灰狼算法(QLGWO)及其多目标版本(MOQLGWO):QLGWO使用Q学习指导灰狼个体基于经验和奖励选择探索或开发动作,实现算法局部和全局搜索的自主平衡; MOQLGWO引入存档和领导选择机制,在搜索衡量多种优化目标的帕累托最优解的同时,引导搜索方向朝未被探索的区域拓展,以逼近全局最优.然后,使用两段五阶多项式来构造机械臂的运动轨迹,需要搜索的解由运行时间以及中间点的关节位置、速度、加速度组成.最后,在12个基准函数上,将QLGWO与GWO以及其他4种先进的元启发式算法进行对比,并使用MOQLGWO求解九自由度冗余机械臂的时间-冲击最优轨迹规划问题.仿真和实验结果表明:所提出QLGWO可有效提高GWO的性能;最优轨迹规划器能够在满足关节约束的前提下获得安全、光滑的时间-冲击最优轨迹,其运行时间小于14 s,冲击处于-0.25 rad/s3~0.15 rad/s3之间.
内 容:原文可通过湖北省科技资源共享服务平台(https://www.hbsts.org.cn/)获取