IJCAIMay, 2018

一种适用所有语言的 “统治者”: 基于对抗多任务学习的多语言对话评价

TL;DR提出了一种跨语言对话评估的 ADVMT 模型,利用神经网络指标对开放域对话系统的表现进行评估,并在两种不同语言的情况下进行评估,结果显示其与人工评估的相关性高于现有指标。