ICLRApr, 2024

通过提升实现对抗模仿学习

TL;DR通过建立加权回放缓冲区的新算法 AILBoost,该文研究了对抗性模仿学习在离策略训练中的有效性,实验证明 AILBoost 相较于 DAC 在控制器状态和像素环境中性能更佳。