Oct, 2020

行为克隆中打击模仿代理的研究

TL;DR本文提出了在部分观测到的情况下,对于专家动作序列上的重复利用问题的对抗性解决方案,以提高在多个部分观测的模仿学习任务中的性能。