ACLAug, 2021

通过观察人类跟随行为实现基于场景指导生成的连续学习

TL;DR研究自然语言指令生成的连续学习,在观察人类用户执行指令的基础上,并比较用户执行结果和系统原始意图的差异,以此作为信号改善系统的指令生成能力。通过与真实用户的交互,系统在语言生成能力方面表现出巨大的进步。