CPG-RL：四足动物步态中枢模式生成器的学习

Nov, 2022

CPG-RL：四足动物步态中枢模式生成器的学习

CPG-RL: Learning Central Pattern Generators for Quadruped Locomotion

Guillaume Bellegarda, Auke Ijspeert

TL;DR本文提出了一种方法，将中心模式发生器（CPG），即振荡器系统，整合到深度强化学习（DRL）框架中，以产生稳健且全向的四足动物运动。模型直接调制内在振荡器设定点的振幅和频率，以及协调不同振荡器间的节律性行为，并可以使用 DRL 探索神经科学相关问题的答案，例如下行途径、振荡器间的耦合和步态生成中的感觉反馈。我们在模拟运用中训练了政策，然后进行 sim-to-real 转移至 Unitree A1，其中我们发现模型行为的鲁棒性优于训练时未见过的干扰，最重要的是动态添加的 13.75 公斤的负载，代表着 115％的名义四足动物质量。我们测试了几种基于本体感官的观察空间，并展示了我们的框架可以在没有任何领域随机化和非常少的反馈的情况下进行部署，它可以提供振荡器状态和触点布尔值。视频结果可在此 https URL 找到。

Abstract

In this letter, we present a method for integrating central pattern generators (CPGs), i.e. systems of coupled oscillators, into the deep reinforcement learning (DRL) framework to produce robust and omnidirectional quadruped locomotion. The agent learns to directly modulate the intrins

central pattern generators deep reinforcement learning quadruped locomotion interoscillator couplings sim-to-real transfer

发现论文，激发创造

机器人运动的 DeepCPG 策略

本研究利用中央模式生成器（CPGs）构建深度强化学习的 DeepCPG 策略层来实现多腿机器人的行走行为，证明其在高维传感器空间中具有实验有效性，并进一步通过模块化机器人和多智能体深度强化学习的方法来推广其应用，展示了生物学原理所建立的更高智能系统的潜在革命性应用。

Feb, 2023

具有学习功能的多个混沌中枢模式发生器用于腿部动力学和故障补偿

本文提出一种基于多个混沌 CPGs 与学习机制的自适应运动策略，用于处理腿部腿部功能失调的情况下的六足机器的运动问题。结果表明，相较于单个 CPG，使用多个 CPG 的性能更优，恰当的设置机械腿的摆动频率可以实现机器人的自适应运动控制。

Jul, 2014

基于中央模式发生器和上脊驱动相互作用的学习性四足运动控制：Puppeteer 和 Marionette

该研究利用深度强化学习模型探究了脊髓中央模式生成器和大脑上行信号在四足动物的前瞻性动作中的相互作用，结果表明，直接上行信号对准确越过空隙具有重要作用，而脊髓中央模式生成器动力学对于步态平稳性和能量效率也有益处。

Feb, 2023

多种四足机器人的单一运动控制策略学习

通过从动物运动控制中获得灵感，我们展示了训练一种有效的单个运动策略，能够控制多样的四足机器人，该策略通过调节中央模式发生器（CPG）的频率和振幅来产生节奏输出，并将其映射到模式形成（PF）层，从而在不同机器人之间仅调整缩放参数以适应步幅高度和长度，我们还检验了此策略在 Unitree Go1 和 A1 机器人上的模拟到实际转移性能，甚至在增加相当于 A1 机器人额定质量的 125% 负载情况下仍然表现良好。

Oct, 2023

Sim-to-Real: 四足机器人学习敏捷运动

本文提出了一种利用深度强化学习技术自动化四足机器人运动设计过程的系统，能够从简单的奖励信号中学习四足运动，并可提供开环参考进行学习过程的控制，采用系统辨识来改进物理模拟器，利用物理环境随机与扰动设计控制器，并在物理模拟器中进行评估，成功在现实世界中部署。

Apr, 2018

通过分散相位振荡器学习新兴步态：关于观察、奖励和反馈的作用

我们提出了一种最小相位振荡器模型来学习四足动物的行走运动，通过本地反馈地面反作用力来实现四足动物的步态表征以及相位观测、基于相位的奖励和局部反馈动力学相结合的策略的发展。

Feb, 2024

学习对称和低能量行走

该论文提出了一种新颖的基于深度强化学习（DRL）方法来训练机器人的步态控制算法，并引入了一种新的课程学习方法来提供适当的物理辅助，帮助机器人保持平衡和前进。

Jan, 2018

结合模型预测控制和预测强化学习实现稳定的四足机器人行走

本文研究了基于模型预测控制和强化学习控制器相结合的四足机器人稳定步态生成问题，并开发了一种融合了这两种方法的混合控制方法，其中采用一个以神经网络建模的 Q 函数形式的尾部成本算法来降低计算复杂度，并证明了我们的控制器在短时间内能够实现稳定步态，具有实时操作的能力。

Jul, 2023

通过相位引导控制器学习四足机器人的自由步态转换

本文提出了学习控制犬形四足机器人在各种步态下运动的框架，并通过强化学习算法解决了多任务学习的问题。使用四个独立的相位来描述步态发生器和控制策略之间的接口，使用该控制策略，黑豹四足机器人可以在自然环境下流畅、稳健地学习所有运动技能并遵循速度命令进行运动。

Jan, 2022

在受限的三维空间中运用强化学习实现灵巧的腿部步行动力学

使用深度強化學習的運動控制器在克服具挑戰性的地形（如崎嶇的岩石、不規則的地面和滑溜的表面）上取得了令人印象深刻的快速和穩健的運動方面的最近突破。但是，相對較少的研究投入到透過狹窄隧道或不規則空洞等局限的 3D 空間中的腿部移動性，這些地方會強加整體限制。因此，我們提議從目標導向的過程中學習在局限的 3D 空間中的運動技能。通過將傳統計劃師負責規劃到達遠處全球目標位置的路徑點與透過生成低層運動指令來跟隨這些路徑點的基於 RL 的策略結合，我們引入一種層次化的運動控制器來解決跟踪遠處導航目標的低效問題。在模擬中，我們的層次化方法成功地在具有挑戰性的局限的 3D 環境中導航，優於純粹的端到端學習方法和參數化的運動技能。我們還展示了在真實機器人上成功部署我們在模擬中訓練的控制器。

Mar, 2024