Feb, 2024
比较摘要模型需要多少注释?
How Much Annotation is Needed to Compare Summarization Models?
Chantal Shaib, Joe Barrow, Alexa F. Siu, Byron C. Wallace, Ani Nenkova
TL;DR在这项研究中,我们通过实证研究了在新闻摘要领域选择最佳性能的模型所需的测试样本大小,发现只需要少于 100 个样本即可收敛,并且人类偏好数据可以在各种下游摘要任务中量化自动评分的能力。