Jun, 2022

可微分物理学的模仿学习

TL;DR本文提出了一种新的基于可微分物理仿真器的模仿学习方法 (ILD),该方法将物理预设作为先验加入到计算图中进行策略学习,在优化过程中动态选择每个状态的学习目标,实现了单循环结构,提高了稳定性和训练速度。在验证中,ILD 在连续控制任务和变形物体操作任务中表现优异,且只需要一次专家演示。