COLINGNov, 2020
对开放领域对话系统进行可配置评估指标的解构与重构
Deconstruct to Reconstruct a Configurable Evaluation Metric for Open-Domain Dialogue Systems
Vitou Phy, Yang Zhao, Akiko Aizawa
TL;DR我们提出了一种灵活的度量方法,并通过组合可管理的质量、将质量分成三组,并将每个方面的指标合成为一个指标,得到了名为 USL-H 的度量方法,证明了 USL-H score 与人工评价具有良好的相关性和可配置性。