Jul, 2024

医学出版物中疾病风险因素的自动提取

TL;DR我们提出了一种新颖的方法来自动化从医学文献中识别疾病风险因素,利用在生物医学领域预训练的模型,并针对特定任务进行调整。通过面对多样化和非结构化的医学文章的挑战,我们的研究引入了一个多步骤系统,首先识别相关文章,然后基于风险因素讨论的存在进行分类,最后通过问答模型提取特定疾病的风险因素信息。我们的贡献包括开发了一个全面的管道用于自动提取风险因素,并编制了几个数据集,这些数据集可作为进一步研究的宝贵资源。这些数据集涵盖了各种疾病以及它们相关的风险因素,并通过精细的评估方案进行了认真的身份验证。我们进行了自动评估和全面的手动评估,展示了令人鼓舞的结果。我们还强调了改进模型和扩大数据集的全面性的重要性,以与快速发展的医学研究领域保持同步。