关键词:带电作业;自主避障;自主导航;层次强化学习;深度强化学习;智能控制
摘 要:为了实现配电网带电作业机械臂的自主避障和自主导航,提出了一种基于子任务的层次深度强化学习算法的机械臂智能控制方法,设计了其对应的环境状态空间、动作策略和奖励函数并开展仿真实验进行效果验证。实验结果表明:全局随机障碍下单一模型成功率平均不足35%,层次模型比单一模型在全空间的决策训练中更易收敛,在跨线作业和设备作业两种场景下避障导航成功率分别可提升至90%和71.01%;同时,提出的安全路径引导奖惩机制可有效提升考虑安全距离下的机械臂作业路径寻优效率。层次深度强化学习模型在应对不同目标及障碍时具有更强的泛化性能,可为实现全自主带电作业提供理论和技术参考。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取