Jan, 2016

从在线协作反馈中学习操作任务的偏好

TL;DR本文提出了一种在线无监督学习框架,可以在包容环境下的多种对象和人类互动中学习机器人的移动路径偏好,并在家政和菜店两种环境中测试了算法,结果表明只需几分钟即可训练机器人。