本文提出了一种安全的强化学习框架,用于设计控制策略,以确保腿部运动的安全,同时利用无模型的强化学习进行学习任务。在此框架基础上,本文进行了四项步态运动实验,并实现了显著的提升,包括节能、稳定性和动作变化。
Mar, 2022
这篇论文研究了如何用增强学习算法训练四肢机器人在复杂环境中实现高速奔跑、跳跃、走路到目的地等多种复杂技能,并且通过从已有的控制器中借鉴经验,解决了机器人探索新环境时的困难,实现了四肢机器人在现实环境中优雅且安全的部署。
Apr, 2023
为了确保机器人等自主车辆的广泛部署,本文提出了一种新的闭环范式用于综合安全控制策略,明确考虑系统在可能的未来情景下的演变不确定性,通过物理动力学和机器人的学习算法共同推理,利用对抗深度强化学习进行放大,展示了该框架能够处理贝叶斯信念传播和大规模预训练神经轨迹预测模型引起的隐式学习。
Sep, 2023
通过层次学习和规划框架,利用试错和模型生成轨迹的方法,本研究通过在线无模型强化学习和预训练微调奖励机制来赋予飞行器在未知和部分可观察环境中适应敏捷性的能力,并在仿真和实际硬件验证中证明了该方法比常数敏捷度基准和替代方法在飞行效率和安全性方面的优势。
Mar, 2024
本文提出了一种混合预测控制器,使用触觉信息和全身动力学来局部预测机器人的未来动作,实现了机器人快速生成灵活的运动。通过跟踪反馈策略,该预测控制器能够在没有使用单独的全身控制器的情况下执行低级扭矩控制。
本文提出了一种利用深度强化学习技术自动化四足机器人运动设计过程的系统,能够从简单的奖励信号中学习四足运动,并可提供开环参考进行学习过程的控制,采用系统辨识来改进物理模拟器,利用物理环境随机与扰动设计控制器,并在物理模拟器中进行评估,成功在现实世界中部署。
Apr, 2018
使用无模型强化学习在仿真环境下训练的,基于镜像世界神经网络的四足机器人运动控制器具有极强的抗扰动性能和泛化能力,能够协调机器人的动作频率和运动速度,实现更加自然和合理的运动模式。
Jul, 2022
本篇论文提出一种端到端学习到的控制器,可为 MIT Mini Cheetah 机器猎豹在天然地形上实现最高时速 3.9m/s 的行动敏捷性,并且具有鲁棒性和抗干扰性。
May, 2022
自主轮足机器人具有改变物流系统的潜力,通过采用自适应步态控制、导航规划和城市内的大规模路径规划等创新解决方案,能够有效实现对复杂环境中的自主导航。
May, 2024
本文提出了一种数据驱动的策略,通过利用模型无关的安全学习算法,自动调整控制增益来简化机器人硬件平台中基于模型的控制器的部署,从而解决了控制制定中所使用的简化模型与实际系统之间的不匹配问题,并通过模拟和硬件实验验证了该方法的有效性。
Jun, 2023