Sep, 2023

AE-GPT: 使用大型语言模型从监测报告中提取不良事件 - 以流感疫苗不良事件为案例

TL;DR利用 1990 年至 2016 年之间的 Vaccine Adverse Event Reporting System (VAERS) 数据,本研究重点评估了大型语言模型(LLMs)在不良事件(AEs)提取方面的能力,其中包括 GPT-2,GPT-3 变体,GPT-4 和 Llama 2 等多种流行 LLMs。其中,经过微调的 GPT 3.5 模型(AE-GPT)在严格匹配方面取得了 0.704 的平均微 F1 分数,松弛匹配方面为 0.816。AE-GPT 的鼓舞人心的表现突出了 LLMs 在处理医疗数据方面的潜力,标志着在高级 AE 检测方面又迈出了重要一步,因此可能推广到其他 AE 提取任务。