May, 2024

深度强化学习中的机械臂控制和抓取行为模仿

TL;DR本研究提出了一种采用 3D 人体姿态估计和强化学习相结合的新型运动模仿模型,通过将运动模仿转化为强化学习中的关节角度预测问题,从而极大减少了对大量训练数据的依赖,使得模型能够从仅有几秒钟的视频中学习模仿策略,并展现出强大的泛化能力。该项目可轻松地将人的手臂运动模仿到机械手臂上,表现出卓越的性能和稳健的迁移能力。