AAAIDec, 2021
MDD-Eval:基于增强数据的自训练多领域对话评估
MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation
Chen Zhang, Luis Fernando D'Haro, Thomas Friedrichs, Haizhou Li
TL;DR提出了 MDD-Eval 框架,通过对话内评价与跨领域自学得到多领域评价能力,从而使得相较于现有自动对话评价指标,其在 6 个评价基准测试中可以取得 7% 的平均 Spearman 相关性分数的显著提高。