ACLMar, 2022
实现对开放域对话系统的可靠人工评估
Achieving Reliable Human Assessment of Open-Domain Dialogue Systems
Tianbo Ji, Yvette Graham, Gareth J. F. Jones, Chenyang Lyu, Qun Liu
TL;DR本文提出了一种可靠且低成本的人类评估方法,以取代已被证明不可靠的自动评估方法,比较了与无人设定的系统相比,使用人设定对话主题的对话系统在对话质量上没有积极的贡献。