Mar, 2022

从实物人类反馈中学习:一种物体为中心的单次适应方法

TL;DR本文介绍了一种人机交互的方法,使用对象为中心的子任务描述人类任务,并根据特定对象检查和更新模型中的权重,以实现机器人的快速且简单的策略自适应。