Jun, 2020

DialoGPT 对话交互的无监督评估

TL;DR本文介绍了 FED 度量(对话的细粒度评估),该度量使用 DialoGPT,不需要微调或监督,以及 FED 数据集,称为人机和人人对话的十八个细粒度对话质量的注释构成。FED 度量不依赖于真实回答,不需要训练数据,并且在回合和整个对话水平上测量细粒度对话质量。FED 在两个级别上与人类判断具有中度到强度的相关性。