ACLMar, 2022

实现对开放域对话系统的可靠人工评估

TL;DR本文提出了一种可靠且低成本的人类评估方法,以取代已被证明不可靠的自动评估方法,比较了与无人设定的系统相比,使用人设定对话主题的对话系统在对话质量上没有积极的贡献。