ACLJun, 2023

C-PMI: 条件点间互信息用于对话轮次评估

TL;DR提出了一种新的模型无关方法,利用条件点互信息来衡量给定评估维度下系统和用户之间的对话交互,实验结果显示,与现有的评估系统相比,该方法在广泛使用的 FED 对话评估数据集上显著提高了与人类判断的相关性,在 FED 评估指标上平均达到了 60.5%的相关性提高率。