TL;DR该论文提出了使用 residual force control (RFC) 方法增强人型控制策略来更好地模仿长期人类动作,实现了学习源自大规模人体动作数据集的多模态无限地人类动作生成。
Abstract
reinforcement learning has shown great promise for synthesizing realistic
human behaviors by learning humanoid control policies from motion capture data.
However, it is still very challenging to reproduce sophisticated human skills
like ballet dance, or to stably imitate long-term huma
本研究提出了一种采用 3D 人体姿态估计和强化学习相结合的新型运动模仿模型,通过将运动模仿转化为强化学习中的关节角度预测问题,从而极大减少了对大量训练数据的依赖,使得模型能够从仅有几秒钟的视频中学习模仿策略,并展现出强大的泛化能力。该项目可轻松地将人的手臂运动模仿到机械手臂上,表现出卓越的性能和稳健的迁移能力。