Oct, 2012

通过降维到 I.I.D. 主动学习实现的主动模仿学习

TL;DR该论文主要介绍了积极模仿学习(active imitation learning)的概念,通过询问专家对单个状态下预期行为的降低学习难度;引入了一种基于 i.i.d. 积极学习的新方法,并分析了该方法对于非定态(non-stationary)和定态(stationary)策略的可行性和性能;最后,该论文提出了一种实用算法,与其他模型相比在四个测试领域表现出较高的效果。