BriefGPT.xyz
Nov, 2019
关于模仿学习价值偏差的研究
On Value Discrepancy of Imitation Learning
HTML
PDF
Tian Xu, Ziniu Li, Yang Yu
TL;DR
本文提出了一种基于差异传播分析法来分析模仿学习方法理论特性的框架,该框架揭示了模仿学习方法在不同设置下的价值差异。通过理论与实验的结合,我们首次分析了GAIL的性能表现,并发现该方法具备比行为克隆更少的复利误差,这为模仿学习算法的未来改进提供了启示。
Abstract
imitation learning
trains a policy from expert demonstrations.
imitation learning
approaches have been designed from various principles, such as
→