AAAIDec, 2023

DiffAIL: 扩散对抗模仿学习

TL;DR引入扩散模型到对抗性模仿学习框架中,提出了一种名为扩散对抗模仿学习(DiffAIL)的方法,以改进传统二元分类器的准确性,从而能更好地捕捉专家示范并提高泛化性能。实验证明,该方法在两个基准任务上达到了最先进的性能,并显著超过了专家演示。