一种应用于关节执行器能力缺失受限条件下的六足机器人自适应控制方法

    技术2025-05-29  51


    本发明涉及足式机器人运动控制,具体而言,涉及一种应用于关节执行器能力缺失受限条件下的六足机器人自适应控制方法。


    背景技术:

    1、随着航空与勘探业的发展,移动机器人在人类不能够进入的地形或环境发挥着重大的作用(如火灾现场、星球探测、深海探测等)。与轮式、履带式机器人相比,六足机器人具有冗余的肢体结构、较多的关节自由度和丰富的步态,因此其对非结构化环境的适应能力更强。然而,在实际应用场景中,地形复杂、环境恶劣,外部破环等因素会导致六足机器人极易出现机械部件损坏、电控系统故障等不良状态,并进一步导致其腿部动力缺失或失效。在此种状态下,机器人可以采用自适应控制方法进行运动的修正,使其保持基本运动功能,甚至实现一定的任务执行能力。

    2、常规的足式机器人自适应控制运动规划方法研究中,仅考虑运动能力健全条件下的六足机器人运动规划,而对运动功能受限条件下的六足机器人运动规划问题研究较少,或仅对机器人的步态控制及机身控制进行单一考量,无法同时兼顾二者的协同控制,限制了六足机器人运动表现的提高。因此,研究六足机器人在关节执行器能力缺失情况下的步态控制及机身控制协同控制的自适应控制方法,无疑可以更好的提高六足机器人在实际复杂场景下的运动表现与现实应用性。


    技术实现思路

    1、本发明针对关节执行器能力缺失引起的六足机器人运动性能下降问题,本发明提供了一种应用于关节执行器能力缺失条件下的六足机器人自适应控制方法,所述方法包括如下步骤:

    2、步骤1,在ros中搭建相应的仿真环境,在该环境下,使用近端策略优化算法(proximal policy optimization,ppo),提出一个名为“执行器效能系数”(actuatorefficiency coefficient,aec),将其作为状态输入,旨在精确量化关节执行器的效能状态。根据六足机器人的关节执行器能力缺失受限这个条件设计奖励函数,并使用该奖励函数对每个关节执行器的可能的受限程度进行训练至模型收敛,共得到十八种控制策略模型。

    3、本专利提出一个名为“执行器效能系数”的状态输入ε,该输入量化了关节执行器的工作状态,从而丰富了ppo算法在训练模型时,对关节执行器能力缺失的机器人物理约束条件的考量。

    4、本专利提出一个基于在世界坐标系∑w(xw,yw,zw)下,zmp点至其支撑多边形在水平面上投影之间的最长距离的奖励项,该奖励项旨在确保即便在执行器效能下降的情形下,机器人仍能保持稳健的运动模式和稳定性。

    5、本专利基于提出的执行器效能系数,提出一个考虑关节执行器的实时效能的能耗奖励项,该奖励项旨在鼓励机器人的节能行动策略。

    6、步骤2,根据执行器受限率的自适应调整机制,对步骤一训练出来的十八种控制策略进行数据采样,这些数据包括不同关节执行器不同效能下,机器人执行器状态、aec值以及策略所输出的最优动作。

    7、基于采样得到的数据序列,训练得到一个基于transformer架构的控制策略模型aec-t(aec-transformer),允许机器人针对关节执行器受限程度进行实时自适应调整,实现连续有效的行走和任务执行。

    8、本发明的一种应用于关节执行器能力缺失受限条件下的六足机器人自适应控制方法的有益效果是:相对于常规的足式机器人运动规划方法,或仅考虑运动能力健全条件下的六足机器人运动规划,基于该框架下的自适应动作规划方式使六足机器人在运动时可根据随机腿部关节运动能力情况,自发地生成满足运动学约束和稳定性约束的最优自适应动作,极大地改进了当前研究中对步态控制及机身控制协同控制考虑的单一性,提高了六足机器人在复杂地形下的运动能力。



    技术特征:

    1.一种应用于关节执行器能力缺失受限条件下的六足机器人自适应控制方法,其构建过程特征在于以下步骤:

    2.如权利要求1所述的一种应用于关节执行器能力缺失受限条件下的六足机器人自适应控制方法,其特征在于:所述的稳定维持奖励项为:在世界坐标系∑w(xw,yw,zw)下,通过计算零力矩点(zero moment point,zmp)至其支撑多边形在水平面上投影之间的最长距离,建立一个维持六足机器人稳定的行动策略的奖励项,形式如下:

    3.如权利要求1所述的一种应用于关节执行器受限条件下的六足机器人自适应控制方法,其特征在于,步骤2所述的自适应调整机制,形式如下:


    技术总结
    本发明属于足式机器人运动控制技术领域。本发明公开了一种应用于关节执行器能力缺失受限条件下的六足机器人自适应控制方法,解决了六足机器人发生关节执行器能力缺失后,运动性能下降问题,具体方法为:首先使用PPO算法,将机器人的关节效能状态作为状态输入的一部分,针对六足机器人关节执行器能力缺失受限这个条件设计奖励函数,对六足机器人每个关节执行器可能的关节能力缺失的情况进行训练,共得到十八个控制策略模型,其次通过离线蒸馏的方式,使用Transformer网络训练,最终得到一个通用的控制策略模型。本发明使六足机器人可根据机器人针对任意单个关节执行器的不同受限程度进行实时自适应调整,实现连续有效的行走和任务执行,提高了六足机器人在崎岖地形下的运动能力以及现实应用性。

    技术研发人员:尤波,李辉,李佳钰,陈晨,程晨晨
    受保护的技术使用者:哈尔滨理工大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-31483.html

    最新回复(0)