Nov, 2016

通过模仿学习信息聚集

TL;DR本篇论文研究的是一个应用于移动机器人自主探索和检查的问题,即在燃料预算有限的情况下最大化从世界中获取的信息量的问题。作者提出了一种新颖的数据驱动的模仿学习框架,并通过 EXPLORE 算法来训练一个策略以模仿一个有完整信息并计算非简约解来最大化获取信息的先知,验证了这一方法在不同对象分布上的适应能力。