Jun, 2022

对话中的相关性:简单优于复杂的度量标准比较与新度量标准

TL;DR评估了现有的对话相关性度量标准,提出了减少数据要求和领域敏感性的改进并在不 fine-tuning 预训练语言模型的情况下,只使用 3750 个未经注释的人类对话和一个负面例子,我们的提议指标实现了 HUMOD dataset 的最新性能,并将数据集敏感性降低了 37%-66%。