ACLApr, 2019

利用蕴涵关系评估对话系统中的一致性

TL;DR本文提出了基于分布式句子表示的可解释计算指标,用于评估开放领域对话系统的主题、话题的连贯性,减少了人工判断实验的时间成本和不可伸缩性,并结合先进的蕴含技术,介绍了可计算的人工判断形式,实现了对大规模数据集上对话质量的无偏估计。