ACLMay, 2020

学习用于在线对话评估的无参考度量

TL;DR本文提出了一种基于预训练语言模型从句子中提取潜在表示并利用它们之间的时间关系进行对话质量评估的自动评估度量标准,不需要人工生成参考回复并在推理过程中不需要真实响应。在在线环境中,该模型与人类评注的相关性更高。