Oct, 2021

具有可变乐观性的演示自信度感知模仿学习

TL;DR本文提出了一种通用框架,称为置信度感知式模仿学习(CAIL),能够从各种最优性的演示中学习置信度评分和一个良好表现策略,广泛应用于机器人控制领域。