AAAIFeb, 2020

对抗模仿学习中防止假反例

TL;DR通过对 Adversarial Imitation Learning 的训练信号做出调整,可以通过减少 False Negatives 的数量,从而在 BabyAI 环境中提高模型的样本效率。