Mar, 2017

DART:注入噪声以实现鲁棒性模仿学习

TL;DR提出了一种注入噪音的离策略方法,在演示时将噪音注入到导师的策略中,强制演示如何从错误中恢复。通过 DART 算法在仿真和实验中的比较,证明了该方法的有效性。