Apr, 2024

利用 LLMs 加速系统评价筛选过程的承诺与挑战

TL;DR系统性综述(SR)是软件工程(SE)中一种常见的研究方法。本研究旨在调查大型语言模型(LLMs)是否能通过简化摘要来加速标题 - 摘要筛选,并自动化标题 - 摘要筛选。研究结果表明,使用 LLMs 进行文本简化在筛选过程中并未显著提高人类的表现,但减少了筛选所需的时间。虽然当前的 LLMs 在筛选任务中并不比人类筛选者更准确,但使用 LLMs 自动化标题 - 摘要筛选似乎是有前景的。需要进一步的研究才能推荐在 SR 筛选过程中使用 LLMs。建议未来的 SR 研究发布包含筛选数据的复制包,以便进行更有说服力的 LLM 筛选实验。