PHEE: 从文本中提取药物监管事件的数据集
本研究介绍了 BioDX,这是一个基于大量生物医学文献的药物不良事件抽取资源,旨在通过自然语言处理提高药品安全监测,并通过预测报告的核心信息来帮助专业 PV 评审员。
May, 2023
本文在生物医学研究中探讨针对药物引起的不良反应提出了一种通过使用自我关注机制以及机器阅读文献的灵感创作的基于问题回答 (Question-Answering) 的模型,能够将这些情况分类提供给医护人员减少药物致死和患病率,并可视化和理解网络如何利用局部和更广泛的上下文进行分类。
Jan, 2018
通过将 ADE 相关的文本信息与视觉辅助工具相结合,我们呈现了一个多模态不良药物事件(MMADE)检测数据集,并引入了一个框架,利用 LLMs 和 VLMs 的能力进行 ADE 检测,生成对描绘 ADE 的医学图像的详细描述,帮助医疗专业人员在视觉上识别不良事件,从而提高总体性能。该方法有望促进患者安全、ADE 意识和医疗可及性,为个性化医疗的进一步探索铺平了道路。
May, 2024
本文使用 T5 模型架构,将不良事件检测和抽取问题视为序列到序列问题,并在多项英语基准测试中取得了较强的性能表现,进一步提出了多任务训练的新策略以提高模型的稳健性和语言转换能力。
Sep, 2021
使用异质文本图形,借助统一医学语言系统中的医学知识,提出了一种基于概念感知注意机制的自然语言处理方法,结合预训练语言模型的上下文化嵌入和卷积图神经网络进行特征表示和关系学习,能有效地自动从文本中检测不良药物事件,表现和最近进展竞争性相当。
Jan, 2023
通过从患者论坛、社交媒体和临床报告中收集多种语言(德语、法语和日语)关于不良药物反应(ADRs)的文本,本研究提供一个多语言语料库,并提供了涵盖 12 种实体类型、4 种属性类型和 13 种关系类型的注释。该语料库对于发展面向医疗保健的真实世界多语言语言模型具有重要意义。我们提供了统计数据来强调与该语料库相关的某些挑战,并进行了初步实验,实现了在语言内部和跨语言之间提取实体和实体之间的关系的强基线。
Mar, 2024
提出了一种新的跨语言的事件抽取数据集,称为 MEE,其中注释了 8 种具有不同语言类型的语言中的 50000 多个实体提及、事件触发和事件参数。在此数据集上进行的实验发现多语言事件抽取的挑战和机遇。
Nov, 2022
通过事件的视角,本文提出了一种用于表征社交话语中与健康相关的信息搜寻的范例。利用 Reddit 帖子进行案例研究,以药物治疗 Opioid Use Disorder (OUD) 为例,建立了 TREAT-ISE 数据集,该数据集包含基于不同事件类型进行注释的 OUD 社交话语中的信息搜寻事件。并借助多个机器学习和深度学习分类器,建立了一个强大的性能基准(77.4% F1 score),并深入研究了 ChatGPT 在这一任务上的表现和错误,提供了有价值的见解和持续的表征工作。
Aug, 2023
本文介绍了一个新的安全预防的 IncidentAI 数据集,与通常只包含单个任务的先前的语料库不同,我们的数据集包括三个任务:命名实体识别、因果关系提取和信息检索。该数据集由至少有六年实践经验的高压气体保护管理员领域的专家进行标注。我们验证了数据集在安全预防场景中的贡献。三个任务的初步结果显示,自然语言处理技术有助于分析事故报告以预防未来的故障。该数据集促进了自然语言处理和事故管理社区的未来研究。同时提供对数据集的访问(IncidentAI 数据集的访问链接:https:// 此处放置链接)。
Oct, 2023