ACLApr, 2024

MSciNLI:科学自然语言推理的多样基准

TL;DR科学自然语言推理(NLI)的任务涉及预测从研究文章中提取的两个句子之间的语义关系。本文介绍了多样性科学 NLI 任务,并提出了 MSciNLI,这是一个包含 132,320 个从五个新科学领域中提取的句子配对的数据集。通过精调预训练语言模型和促使大型语言模型建立了 MSciNLI 的强基准。最高的 PLM 和 LLM 基准的宏 F1 分数分别为 77.21% 和 51.77%,说明 MSciNLI 对这两种模型来说都具有挑战性。此外,我们证明了领域转移降低了科学 NLI 模型的性能,从而证明了我们数据集中不同领域的多样性特征。最后,我们在中间任务迁移学习设置中使用了两个科学 NLI 数据集,并展示了它们可以提高科学领域下游任务的性能。我们在 Github 上提供了数据集和代码。