基于事件的监测中流行病信息提取的研究:利用大型语言模型
本文调查了基于文本数据集的疫情情报中,选择相关文本和预测疫情事件的健康提及分类和健康事件检测方法,着重讨论了这两类方法中的计算语言学技术,同时提供了流行病情报的注释技术、资源和评估策略的最新状况。
Mar, 2019
通过系统性文献综述,全面考察了在预测和异常检测中使用大规模语言模型(LLMs)的应用,突出了现有研究的现状、固有挑战和未来发展方向。LLMs已经在解析和分析大规模数据集以识别模式、预测未来事件和检测异常行为等各个领域展现了巨大潜力。然而,该综述指出了一些关键挑战,如依赖于大量历史数据集、在不同背景中的泛化问题、模型产生幻觉的现象、模型知识范围的局限性以及需要大量计算资源等,这些挑战阻碍了它们更广泛的应用和有效性。通过详细分析,本综述讨论了克服这些障碍的潜在解决方案和策略,如整合多模态数据,学习方法的进步以及强调模型可解释性和计算效率。此外,该综述还概述了可能影响LLMs在这些领域中发展的关键趋势,包括朝向实时处理、可持续建模实践的重要性和跨学科合作的价值。最后,该综述强调了LLMs对预测和异常检测可能产生的转变性影响,同时强调了持续创新、道德考虑和实际解决方案的需求以实现其全部潜力。
Feb, 2024
社交媒体为时事趋势和事件提供了便捷获取信息的平台,我们通过开发一个提取和分析社交媒体帖子中流行病相关事件的框架,利用事件检测技术实现更好的灾害预防和预警,为新兴流行病的应对提供了基础。
Apr, 2024
我们提出了PandemicLLM,这是一个新颖的框架,利用多模态大型语言模型将疾病传播的实时预测转化为文本推理问题,能够整合实时、复杂、非数值型信息,并在COVID-19大流行中得到应用。该研究揭示了适用大型语言模型和表征学习提升疫情预测的潜力,展示了人工智能创新如何加强未来的疫情应对和危机管理。
Apr, 2024
本文综述了最近在利用机器学习技术(尤其是Transformer 模型)预测疫情期间人类流动模式方面的进展。了解疫情期间人们的流动情况对于建立疾病传播模型和制定有效的应对策略至关重要。预测人口流动对于提供流行病学模型的信息和在公共卫生紧急情况下实施有效的应对计划非常关键。预测流动模式可以使当局更好地预测疾病的地理和时间传播情况,更高效地分配资源,并实施有针对性的干预措施。我们回顾了一系列方法,这些方法既利用了像BERT这样的预训练语言模型,也利用了专门针对流动性预测任务设计的大型语言模型(LLMs)。这些模型在捕捉文本数据中的复杂时空依赖关系和上下文模式方面表现出重要潜力。
Apr, 2024
基于对LLMs在公共卫生任务中的自动评估,将六个外部注释数据集与七个新的内部注释数据集相结合,评估LLMs在处理与健康负担、流行病学危险因素和公共卫生干预相关的文本中的性能,发现Llama-3-70B-Instruct是性能最好的模型,在15个任务中取得最佳结果。这些初步结果表明,LLMs可能成为公共卫生专家从各种免费文本来源中提取信息,并支持公共卫生监测、研究和干预的有用工具。
May, 2024
本篇研究旨在评估LLMs和传统深度学习模型在提取AE信息方面的有效性,并评估这些模型集成对性能的影响。研究发现,利用优化后的传统深度学习模型和LLMs进行集成,能够在提取疫苗、注射和不良事件方面实现最高性能,同时对整体性能的评估也得到了显著提高。这项研究对生物医学自然语言处理的发展做出了贡献,并为从文本数据中提取AE相关信息的药物监测和公共卫生监测提供了宝贵的见解。
Jun, 2024
基于构建了MidEast-TE-mini数据集,通过广泛实验证明,与将原始文本直接集成到LLMs输入相比,将原始文本融入特定复杂事件中并对LLMs进行微调能够显著提高性能,同时使用检索模块可以有效捕捉隐藏在历史事件中的时间关系模式,同时还揭示了在LLMs中仍存在的流行度偏见和长尾问题,为基于LLM的事件预测方法和未来的研究方向提供了深入理解和重要启示。
Jul, 2024
本研究针对热带和传染病相关研究的不足,构建了一个扩展的开源数据集,包括人口统计和语义临床信息,包含超过11000个提示。通过系统实验,我们发现上下文信息(如人口统计、地点和性别)对大型语言模型的响应具有重要影响,并开发了TRINDs-LM原型工具,帮助研究上下文如何影响健康领域的LLM输出。
Sep, 2024