Oct, 2022

不要照搬老师: 实体对话中的数据和模型挑战

TL;DR本文探讨如何训练和评估在自然语言交互中完成复杂任务的代理人,指出基于模仿学习的度量指标会误导并阻碍进展,提出应关注高级语义目标,将着眼点从低级行动度量指标推向更高层面。