BriefGPT.xyz
Ask
alpha
关键词
fed dataset
搜索结果 - 2
ACL
C-PMI: 条件点间互信息用于对话轮次评估
提出了一种新的模型无关方法,利用条件点互信息来衡量给定评估维度下系统和用户之间的对话交互,实验结果显示,与现有的评估系统相比,该方法在广泛使用的 FED 对话评估数据集上显著提高了与人类判断的相关性,在 FED 评估指标上平均达到了 60.
→
PDF
a year ago
DialoGPT 对话交互的无监督评估
本文介绍了 FED 度量(对话的细粒度评估),该度量使用 DialoGPT,不需要微调或监督,以及 FED 数据集,称为人机和人人对话的十八个细粒度对话质量的注释构成。FED 度量不依赖于真实回答,不需要训练数据,并且在回合和整个对话水平上
→
PDF
4 years ago
Prev
Next