Feb, 2024

科学摘要评估的反思:在面向因素的基准上建立可解释指标

TL;DR本研究分析和评估了预训练的大型语言模型在科学文献摘要中的应用,并介绍了 Facet-aware Metric 评估方法以及 Facet-based 科学摘要数据集的构建。研究表明,Facet-aware Metric 提供了一种更加合理的科学摘要评估方法,而在科学领域,经过精细调整的较小模型可以与大型语言模型竞争,但大型语言模型在学习科学领域中的上下文信息方面存在局限性,需要进一步改进。