Jan, 2019

第二次对话智能挑战赛(ConvAI2)

TL;DR本文介绍了 ConvAI2 NeurIPS 竞赛的设置和结果,表明预训练 Transformer 变体是当前最佳的聊天机器人模型,但为了提高系统在与人类进行多轮会话的性能,未来的系统必须超越单词单一度量标准(如困惑度)来对话序列进行度量 —— 例如对话行为的重复性、一致性和平衡(例如问答问题的数量)。