ACLMay, 2023

如何确定合适的校准样本特征?长篇科学总结相关性鉴定

TL;DR本文研究文摘模型的校准问题,发现通过多样的候选池和调整不同的选择策略可以提高校准效果。在三个不同的长篇文本摘要数据集上测试,发现对于可靠性校准最好采用一些可能被生成的摘录作为反例集合,而对于相关性校准则应该最大化候选集之间的度量间隔,同时最小化模型和度量定义的排名差异。