Jul, 2018

EnsembleDAgger:一种安全模仿学习的贝叶斯方法

TL;DR本文提出一种名为 EnsembleDAgger 的算法,其通过使用神经网络集合来近似高斯过程,并以方差作为信心的衡量标准,在最大化学习效果的同时,限制了失败的可能性,从而提高了机器人的安全性能。