EMNLPOct, 2019

执行定位协作交互中的指令

TL;DR我们研究了一种协作场景,其中用户不仅指示系统完成任务,而且与系统一起行动。我们通过建立一个游戏环境来研究这个场景,并学习将用户的指令映射到系统的动作,以实现误差恢复和多目标指令的显式推理。我们通过新的评估协议和人类用户的交互和在线游戏进行评估,并观察用户如何适应系统的能力。