从人类演示中学习语义感知的运动技能
本文介绍了一个名为 PRELUDE 的层级学习框架,其中包括高层决策和低层步态生成。在该框架中,高层导航控制器用人类演示进行了模仿学习,而低层步态控制器则使用强化学习获得多样化的步态。该方法在仿真和硬件实验中表现出色。
Sep, 2022
使用无模型强化学习在仿真环境下训练的,基于镜像世界神经网络的四足机器人运动控制器具有极强的抗扰动性能和泛化能力,能够协调机器人的动作频率和运动速度,实现更加自然和合理的运动模式。
Jul, 2022
本文提出了一种利用深度强化学习技术自动化四足机器人运动设计过程的系统,能够从简单的奖励信号中学习四足运动,并可提供开环参考进行学习过程的控制,采用系统辨识来改进物理模拟器,利用物理环境随机与扰动设计控制器,并在物理模拟器中进行评估,成功在现实世界中部署。
Apr, 2018
使用稀疏的视觉观察来实现知觉运动,并提出一种学习框架以有效地学习反馈控制策略,可在人类中心的环境中在道路上行驶,越过不同的障碍,包括台阶、斜坡、间隙和楼梯。
Sep, 2021
本文介绍一种利用层次化框架实现四足机器人路径跟踪任务的方法,其中高层策略以潜在空间向低层策略发出指令,并控制其执行的时间,低层策略使用潜在指令和机器人传感器来控制机器人的执行器,以完成任务需求,同时可以实现训练后的低层策略的高效迁移,为实现端到端的层次化深度学习提供了理论支持。
May, 2019
本文提出了一个新的学习框架,使得机器人可以成功地遵循自然语言路线指令,而无需任何先前环境的知识。该算法利用通过命令传达给机器人的空间和语义信息来学习关于空间扩展环境的度量和语义属性的分布,并将自然语言指令解释为关于预期行为的分布。通过对地图和状态分布进行推理,使用模仿学习的新型置信空间规划器直接求解策略,我们在可声控轮椅上评估了我们的框架。结果表明,通过学习和推理潜在的环境模型,该算法能够成功地遵循新颖的扩展环境中的自然语言路线指令。
Mar, 2015
本文提出了一种新的算法,可以推断关于动态系统参数的信息,同时从先前的观察中估计有关机器人状态的重要信息,并将其与 Adversarial Motion Priors 结合,实现了机器人在真实世界中稳定、灵活和自然的步态,从实验结果中发现相对于基线算法,我们提出的算法能够以更低的功耗遍历具有挑战性的地形。
Apr, 2023
该论文讨论了如何通过在模拟中训练四足机器人学习步行和使用前腿攀爬墙壁、按按钮、与物品交互等技能,并通过行为树将这些技能结合起来执行任务,并使用分阶段的课程和 sim2real 变体在现实世界中应用这些技能。
Mar, 2023
提出了一种新颖的机器人系统,通过持续在线学习和自我监督来适应部署环境,解决了传统机器人学习固定模型的问题。实验结果表明,在语义感知领域的持续学习和回溯有助于降低遗忘风险,提高了分割和定位精度,相比部署固定模型,平均分割提高 60%,定位精度提高 10%。
May, 2021