Apr, 2024

PairEval:使用配对比较进行开放域对话评价

TL;DR提出了一种基于对话响应之间的比较评估的对话评估度量方法 PairEval,该度量方法比基准度量方法更具鲁棒性,并且与人类判断的相关性更高。