Nov, 2023

CSMeD:填补自动引文筛选中系统文献综述的数据集空白

TL;DR在本研究中,我们分析引用筛选评估数据集,揭示了许多可用数据集存在的问题,例如太小、数据泄漏以及对于将自动化文献筛选系统视为分类任务而不是检索或问答任务有限适用性。为了解决这些挑战,我们介绍了 CSMeD,这是一个集合了九个公开释放的文献综述集合的元数据集,提供统一访问 325 个医学和计算机科学领域的系统化文献综述资源。此外,我们还介绍了专门用于评估全文出版物筛选任务的新数据集 CSMeD-FT。通过实验和建立新数据集的基线,我们展示了 CSMeD 的实用性。