ACLApr, 2019
利用蕴涵关系评估对话系统中的一致性
Evaluating Coherence in Dialogue Systems using Entailment
Nouha Dziri, Ehsan Kamalloo, Kory W. Mathewson, Osmar Zaiane
TL;DR本文提出了基于分布式句子表示的可解释计算指标,用于评估开放领域对话系统的主题、话题的连贯性,减少了人工判断实验的时间成本和不可伸缩性,并结合先进的蕴含技术,介绍了可计算的人工判断形式,实现了对大规模数据集上对话质量的无偏估计。