NIPSJun, 2013

通过迭代改进学习机械臂的运动轨迹偏好

TL;DR本文介绍了一种基于协同在线学习框架的方法,通过给机器人提供用户轨迹的偏好反馈而不是直接演示最优轨迹来教授其物体操作任务,理论上说明了该方法的可行性并在多项超市结帐任务中验证了其普适性。