通过经验转移学习和适应敏捷运动技能
该论文提出了一种基于强化学习的实际机器人强化学习系统,通过在现实世界中微调机器人运动策略的少量训练,实现了 A1 四足机器人在多种环境中自主微调多种运动技能的能力。
Oct, 2021
使用深度强化学习(RL)创建动态双足机器人的运动控制器的综合研究,包括开发可用于周期性行走、跑步、跳跃和站立等一系列动态双足技能的通用控制解决方案,该 RL 控制器采用新颖的双重历史架构,通过长期和短期的输入 / 输出(I/O)历史数据有效训练,并在模拟和实际世界的各种技能中始终表现优秀。
Jan, 2024
本研究提出了一个层次框架,将基于模型的控制和强化学习相结合,为四足动物(Unitree Laikago)合成鲁棒控制器。通过学习选择一套原语响应环境中的变化,使其适应复杂的环境变化,并具有更高的能源效率和更强的鲁棒性。
Sep, 2020
通过使用动物和人类的知识来激发机器人创新,我们提出了一个框架,使四肢机器人能够在复杂环境中具备像真实动物一样的灵活性和策略。通过利用先进的深度生成模型产生模拟动物行为的运动控制信号,我们的方法通过预训练感知动物运动的生成模型,将原始知识保留并重复利用于环境适应性学习阶段,最终在复杂的下游任务中通过任务特定控制器解决任务,从而推动了机器人控制的前沿。
Aug, 2023
使用深度強化學習的運動控制器在克服具挑戰性的地形(如崎嶇的岩石、不規則的地面和滑溜的表面)上取得了令人印象深刻的快速和穩健的運動方面的最近突破。但是,相對較少的研究投入到透過狹窄隧道或不規則空洞等局限的 3D 空間中的腿部移動性,這些地方會強加整體限制。因此,我們提議從目標導向的過程中學習在局限的 3D 空間中的運動技能。通過將傳統計劃師負責規劃到達遠處全球目標位置的路徑點與透過生成低層運動指令來跟隨這些路徑點的基於 RL 的策略結合,我們引入一種層次化的運動控制器來解決跟踪遠處導航目標的低效問題。在模擬中,我們的層次化方法成功地在具有挑戰性的局限的 3D 環境中導航,優於純粹的端到端學習方法和參數化的運動技能。我們還展示了在真實機器人上成功部署我們在模擬中訓練的控制器。
Mar, 2024
本文提出了一种利用深度强化学习技术自动化四足机器人运动设计过程的系统,能够从简单的奖励信号中学习四足运动,并可提供开环参考进行学习过程的控制,采用系统辨识来改进物理模拟器,利用物理环境随机与扰动设计控制器,并在物理模拟器中进行评估,成功在现实世界中部署。
Apr, 2018