AAAIFeb, 2020
对抗模仿学习中防止假反例
Combating False Negatives in Adversarial Imitation Learning
Konrad Zolna, Chitwan Saharia, Leonard Boussioux, David Yu-Tung Hui, Maxime Chevalier-Boisvert...
TL;DR通过对 Adversarial Imitation Learning 的训练信号做出调整,可以通过减少 False Negatives 的数量,从而在 BabyAI 环境中提高模型的样本效率。