Oct, 2022

高效示教学习的规划

TL;DR提出了 EfficientImitate 这一基于规划的模仿学习方法,成功地将两类看似不兼容的模仿算法:行为克隆和对抗模仿学习,自然地统一到了一个框架中,实现了在性能和样本效率方面的高水平。