不同环境中的单刚体角色自适应跟踪
本研究旨在将数据驱动的行为规范与能够在物理模拟中执行类似行为的系统相结合,以实现对扰动和环境变化的逼真响应。通过将运动模仿目标与任务目标相结合,我们可以训练出能够在交互环境中智能反应的角色,例如向所需方向行走或向用户指定目标扔球。同时,本研究探讨了多种集成多个运动片段的方法,以开发出能够执行丰富多样的技能的多才多艺的代理。
Apr, 2018
本研究使用深度强化学习的 actor-critic 算法,利用物理模拟器的完全状态可观测性,针对机器人操作中的部分观测(RGBD 图像)的问题进行训练,通过使用不对称输入来显著提高性能,并使用领域随机化的方法,实现了在没有真实世界数据的情况下,在真实机器人上进行的模拟到真实世界的转移。
Oct, 2017
本文介绍应用生成对抗性模仿学习方法,通过有限的高维仿人体运动演示数据,训练神经网络策略以产生类人的运动模式,并利用该方法构建子技能策略解决高维身体姿态控制任务。
Jul, 2017
本研究提出通过使用逆向渲染和可微分仿真相结合的方法,从深度或 RGB 视频中创建真实世界关节机构的数字孪生,该方法可以自动发现关节类型和估计其运动学参数,并调整整个机构的动态特性以实现物理上准确的仿真。
Mar, 2022
本文提出了一种名为 DiffMimic 的新型运动模仿方法,利用可微物理模拟器 (DPS) 降低了模仿的时间成本和样本成本,并且克服了现有方法中存在的一些问题。实验结果表明,DiffMimic 在标准测试中具有更好的样本和时间效率,使得物理仿真角色可以在较短的时间内学习到 Backflip 和循环,从而为未来更多的可微动画系统,如可微服装仿真,带来更多研究机会。
Apr, 2023
在动态运动生成任务中,微小的策略参数变化可能导致完全不同的结果。本研究提出了一种多任务强化学习算法,用于适应单一运动类别中目标或环境的隐式变化,通过不同的奖励函数或物理环境参数。使用单脚机器人模型对球的头球任务进行了评估,结果表明该方法能够适应目标位置或球的恢复系数的隐式变化,而标准的领域随机化方法无法适应不同的任务设置。
Aug, 2023
本研究提出了一种基于深度姿态估计和深度强化学习的方法,使得物理模拟的角色能够从公开视频片段中学习技能,并提供了一个快速设计角色控制器的方法,结果是鲁棒的,并能够适应新的环境并预测人类动作.
Oct, 2018
本研究提出了一种利用强化学习、物理模拟器和稀疏传感器数据实时将人类运动重定向到具有不同骨架结构的角色的方法,并仅需要运用运动捕捉数据进行培训,同时探讨了该框架中的重要组件。
Jul, 2023