欢迎访问行业研究报告数据库

行业分类

当前位置:首页 > 报告详细信息

找到报告 1 篇 当前为第 1 页 共 1

机械臂运动的示教学习方法与应用研究
作者:胡晋 加工时间:2019-04-20 信息来源:浙江大学
关键词:机器人运动规划;;机器人运动控制;;示教学习;;逆强化学习;;外力估计
摘 要:运动规划是机器人系统的核心关键技术之一。现阶段的机器人运动规划所包含的专业知识对普通用户设置较高门槛,极大地限制了机器人的大规模推广。示教学习方法提供了一种简单直观的机器人运动规划方法,能够大大降低机器人的学习使用成本。但示教学习方法在机器人系统上的部署应用需要解决多方面的问题,包括动作学习过程中人机对应、动作表示与建模、泛化动作生成等问题以及动作执行过程中未知外力影响下的运动控制等问题。在这一背景下,本文围绕机器人的运动规划与控制任务,首先针对示教学习中人机对应、动作表示与建模、动作泛化等多方面的问题做出相应分析,提出动作策略学习和动作回报学习的框架和具体方法,然后面对未知外力给动作执行带来的影响,深入研究了外力估计这一问题,在动力学建模、观测器与控制器设计等方面提出一套完整的解决方案。本文研究成果主要包括:(1)提出了一套面向仿人型机械臂系统的动作策略学习方法。首先为解决人机间结构和运动能力差异带来的示教数据对应问题,提出改进的仿射变换方法,能够保证手臂末端和肘部的位置跟踪精度且保持人体动作数据的仿射不变性。完成人机对应后,提出同时学习末端和肘部运动轨迹的概率建模方法,能够保证动作的仿人性并建模多组示教数据的不确定性。为快速生成适应新环境的运动轨迹,提出结合动态运动单元和所学习的概率模型来分别生成末端和肘部轨迹的方法。为了让机械臂同时跟踪新生成的末端和肘部轨迹,提出基于序列二次规划的关节轨迹生成方法,并提出基于弗雷歇距离的关节角选择算法来初始化关节轨迹生成方法。所提出方法在仿人型机械臂的乒乓球挥拍动作学习的任务中进行了验证。实验结果表明所提出方法能够保证人机对应和学习泛化所得到的动作的仿人性,生成关节轨迹的成功率高、优化时间短。(2)提出了一种多阶段动作回报学习方法。针对示教数据的分阶段局部最优特性,即示教轨迹的不同阶段对应不同回报函数,提出同步轨迹分段与回报学习方法。该方法首先使用基于采样的逆强化学习算法提取加窗轨迹段特征,通过比较相邻窗口轨迹段的特征得到初始分段点,然后基于动态规划方法在初始分段点的邻域搜索最优分段点,最后使用基于采样的逆强化学习算法得到各子阶段的回报函数。该方法的优点是不对回报函数的个数和类型做出限制,并且所得到的回报函数适用于机械臂动作规划这一具有高维连续状态空间的任务。为生成新运动轨迹,提出基于泛函优化的轨迹生成方法。该方法结合学习到的子阶段回报函数及其他约束项如避障、到点约束来生成总的轨迹回报泛函,并采用泛函梯度方法生成新轨迹。所提出方法在仿真环境中的零件操作实验和真实环境中的水杯搬运实验中进行了验证。实验结果表明所提出同步轨迹分段与回报学习方法对于示教数据分段结果更加准确,所学到的各子阶段回报函数能够准确表示相应阶段的运动性质,并且动作生成方法得到的轨迹能够适应新的任务场景并符合各子阶段的运动性质。(3)提出了结合半参数模型和扰动卡尔曼滤波器的未知外力估计方法。该方法分为建模和观测器设计两个主要步骤。在建模步骤,提出半参数逆动力学建模方法。该方法先训练参数化的刚体动力学模型,然后加入非参数化的多层感知机神经网络模型来补偿参数化模型的建模误差。得到的半参数逆动力学模型兼具物理意义明确与建模误差小的优点。在观测器设计步骤,提出一种名为扰动卡尔曼滤波器的观测器设计方法。扰动卡尔曼滤波器的过程模型方程同时考虑了机械臂逆动力学模型和外力矩动力学模型,并被重构为线性时不变系统,无需计算系统雅克比矩阵。为了提高作业执行安全性,提出基于扰动卡尔曼滤波器的机械臂碰撞检测和安全响应的控制方法。所提出建模、估计和控制方法通过仿真和实物实验进行了验证。实验结果表明所提出方法能够提高机械臂逆动力学建模精度,提高外力估计结果的准确性和鲁棒性,并有效检测碰撞的发生并做出安全响应。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取
© 2016 武汉世讯达文化传播有限责任公司 版权所有
客服中心

QQ咨询


点击这里给我发消息 客服员


电话咨询


027-87841330


微信公众号




展开客服