ACLApr, 2020

None of the Above”: 评估对话响应检索中的不确定性

TL;DR本文讨论了揭示端到端对话任务中的不确定性的重要性,并在 Ubuntu 对话语料库上展示了关于不确定性分类的实验结果。我们展示了,不必为此特定目的重新训练模型,可以通过微不足道的计算捕获原始检索模型关于最佳预测的潜在置信度。