Mar, 2016

从人类反馈学习机器人到人类的动态物体递交

TL;DR本文介绍了一种基于学习算法的动态物体移交方法,通过与人类交互学习物体移交的潜在报酬,使机器人能够自然地适应人体运动的动态,并通过上下文策略搜索来建立问题模型。