不同环境中的单刚体角色自适应跟踪

Aug, 2023

不同环境中的单刚体角色自适应跟踪

Adaptive Tracking of a Single-Rigid-Body Character in Various Environments

Taesoo Kwon, Taehong Gu, Jaewon Ahn, Yoonsang Lee

TL;DR通过仿真和基于深度强化学习的单刚体角色模拟，本研究提出了一个训练策略以适应各种未知环境变化和控制器转换的方法，并演示了在一个小时内在便携式笔记本上有效训练策略的能力。

Abstract

Since the introduction of deepmimic [Peng et al. 2018], subsequent research has focused on expanding the repertoire of simulated motions across various scenarios. In this study, we propose an alternative approach for this goal, a →

deepmimic deep reinforcement learning centroidal dynamics model single rigid body policy

发现论文，激发创造

DeepMimic：基于示例的物理角色技能深度强化学习

本研究旨在将数据驱动的行为规范与能够在物理模拟中执行类似行为的系统相结合，以实现对扰动和环境变化的逼真响应。通过将运动模仿目标与任务目标相结合，我们可以训练出能够在交互环境中智能反应的角色，例如向所需方向行走或向用户指定目标扔球。同时，本研究探讨了多种集成多个运动片段的方法，以开发出能够执行丰富多样的技能的多才多艺的代理。

Apr, 2018

基于图像的机器人学习的非对称演员 - 评论家算法

本研究使用深度强化学习的 actor-critic 算法，利用物理模拟器的完全状态可观测性，针对机器人操作中的部分观测（RGBD 图像）的问题进行训练，通过使用不对称输入来显著提高性能，并使用领域随机化的方法，实现了在没有真实世界数据的情况下，在真实机器人上进行的模拟到真实世界的转移。

Oct, 2017

通过对抗性模仿从动作捕捉学习人类行为

本文介绍应用生成对抗性模仿学习方法，通过有限的高维仿人体运动演示数据，训练神经网络策略以产生类人的运动模式，并利用该方法构建子技能策略解决高维身体姿态控制任务。

Jul, 2017

从 RGBD 视频推断关节刚体动力学

本研究提出通过使用逆向渲染和可微分仿真相结合的方法，从深度或 RGB 视频中创建真实世界关节机构的数字孪生，该方法可以自动发现关节类型和估计其运动学参数，并调整整个机构的动态特性以实现物理上准确的仿真。

Mar, 2022

学习对称和低能量行走

该论文提出了一种新颖的基于深度强化学习（DRL）方法来训练机器人的步态控制算法，并引入了一种新的课程学习方法来提供适当的物理辅助，帮助机器人保持平衡和前进。

Jan, 2018

DiffMimic：可微物理模拟的高效动作模仿

本文提出了一种名为 DiffMimic 的新型运动模仿方法，利用可微物理模拟器 (DPS) 降低了模仿的时间成本和样本成本，并且克服了现有方法中存在的一些问题。实验结果表明，DiffMimic 在标准测试中具有更好的样本和时间效率，使得物理仿真角色可以在较短的时间内学习到 Backflip 和循环，从而为未来更多的可微动画系统，如可微服装仿真，带来更多研究机会。

Apr, 2023

隐式多任务强化学习问题的政策调整方法

在动态运动生成任务中，微小的策略参数变化可能导致完全不同的结果。本研究提出了一种多任务强化学习算法，用于适应单一运动类别中目标或环境的隐式变化，通过不同的奖励函数或物理环境参数。使用单脚机器人模型对球的头球任务进行了评估，结果表明该方法能够适应目标位置或球的恢复系数的隐式变化，而标准的领域随机化方法无法适应不同的任务设置。

Aug, 2023

QuestEnvSim：基于环境感知的稀疏传感器模拟运动跟踪

使用强化学习相结合的物理模拟和环境观察，可以在高度约束的环境中生成逼真的全身姿势，从而避免接触的干扰。

Jun, 2023

从视频中使用强化学习进行物理技能训练

本研究提出了一种基于深度姿态估计和深度强化学习的方法，使得物理模拟的角色能够从公开视频片段中学习技能，并提供了一个快速设计角色控制器的方法，结果是鲁棒的，并能够适应新的环境并预测人类动作.

Oct, 2018

基于物理的稀疏输入运动重定向

本研究提出了一种利用强化学习、物理模拟器和稀疏传感器数据实时将人类运动重定向到具有不同骨架结构的角色的方法，并仅需要运用运动捕捉数据进行培训，同时探讨了该框架中的重要组件。

Jul, 2023