Jun, 2024

词汇的重要性:什么影响了摘要的领域适应性?

TL;DR通过分析训练数据中的`词汇'对总结任务的具体影响,本文研究细粒度因素对于领域适应性能的影响,并提出将数据集学习难度量化为生成式总结的学习难度,并得出跨域重叠与总结任务的性能增益之间存在近似线性关系的实验结论,从而实现对未知领域数据集模型性能的预测而无需经过训练。