Nov, 2019

关于模仿学习价值偏差的研究

TL;DR本文提出了一种基于差异传播分析法来分析模仿学习方法理论特性的框架,该框架揭示了模仿学习方法在不同设置下的价值差异。通过理论与实验的结合,我们首次分析了GAIL的性能表现,并发现该方法具备比行为克隆更少的复利误差,这为模仿学习算法的未来改进提供了启示。