Jan, 2014

通过可信度自主学习的交互式策略学习

TL;DR本文提出一种基于信心的自治交互算法,通过两个组件(自信的执行和纠正演示)实现从人体演示中学习策略,旨在提升策略学习和任务表现的效果,并在模拟驾驶中进行了比较和评估。