PHEE: 从文本中提取药物监管事件的数据集

EMNLPOct, 2022

PHEE: 从文本中提取药物监管事件的数据集

PHEE: A Dataset for Pharmacovigilance Event Extraction from Text

Zhaoyue Sun, Jiazheng Li, Gabriele Pergola, Byron C. Wallace, Bino John...

TL;DR本研究描述了 PHEE 数据集，该数据集包括超过 5000 个医疗案例报告和生物医学文献，是该领域迄今为止最大的公共数据集，用于药物安全、药物监测，从而可以通过自动化迅速识别安全信号。同时，我们还评估了目前的生物医学事件提取的方法，指出其局限性，并强调了未来研究所面临的挑战。

Abstract

The primary goal of drug safety researchers and regulators is to promptly identify adverse drug reactions. Doing so may in turn prevent or reduce the harm to patients and ultimately improve public health. Evaluating and monitoring →

drug safety pharmacovigilance natural language models dataset biomedical event extraction

发现论文，激发创造

BioDEX：大规模生物医学不良药物事件提取，用于真实世界的药物监测

本研究介绍了 BioDX，这是一个基于大量生物医学文献的药物不良事件抽取资源，旨在通过自然语言处理提高药品安全监测，并通过预测报告的核心信息来帮助专业 PV 评审员。

May, 2023

一种针对生物医学文本的关注序列模型用于不良药物反应提取

本文在生物医学研究中探讨针对药物引起的不良反应提出了一种通过使用自我关注机制以及机器阅读文献的灵感创作的基于问题回答 (Question-Answering) 的模型，能够将这些情况分类提供给医护人员减少药物致死和患病率，并可视化和理解网络如何利用局部和更广泛的上下文进行分类。

Jan, 2018

利用多模态数据集增强不良药物事件的检测：语料库构建与模型开发

通过将 ADE 相关的文本信息与视觉辅助工具相结合，我们呈现了一个多模态不良药物事件（MMADE）检测数据集，并引入了一个框架，利用 LLMs 和 VLMs 的能力进行 ADE 检测，生成对描绘 ADE 的医学图像的详细描述，帮助医疗专业人员在视觉上识别不良事件，从而提高总体性能。该方法有望促进患者安全、ADE 意识和医疗可及性，为个性化医疗的进一步探索铺平了道路。

May, 2024

探索一种用于社交媒体中医疗产品安全监测的统一序列转换器

本文使用 T5 模型架构，将不良事件检测和抽取问题视为序列到序列问题，并在多项英语基准测试中取得了较强的性能表现，进一步提出了多任务训练的新策略以提高模型的稳健性和语言转换能力。

Sep, 2021

基于知识增强的概念感知注意力图神经网络用于不良药物反应检测

使用异质文本图形，借助统一医学语言系统中的医学知识，提出了一种基于概念感知注意机制的自然语言处理方法，结合预训练语言模型的上下文化嵌入和卷积图神经网络进行特征表示和关系学习，能有效地自动从文本中检测不良药物事件，表现和最近进展竞争性相当。

Jan, 2023

一个药物监测的数据集：跨语言标注德语、法语和日语中的不良药物反应

通过从患者论坛、社交媒体和临床报告中收集多种语言（德语、法语和日语）关于不良药物反应（ADRs）的文本，本研究提供一个多语言语料库，并提供了涵盖 12 种实体类型、4 种属性类型和 13 种关系类型的注释。该语料库对于发展面向医疗保健的真实世界多语言语言模型具有重要意义。我们提供了统计数据来强调与该语料库相关的某些挑战，并进行了初步实验，实现了在语言内部和跨语言之间提取实体和实体之间的关系的强基线。

Mar, 2024

MEE：一份新颖的多语言事件提取数据集

提出了一种新的跨语言的事件抽取数据集，称为 MEE，其中注释了 8 种具有不同语言类型的语言中的 50000 多个实体提及、事件触发和事件参数。在此数据集上进行的实验发现多语言事件抽取的挑战和机遇。

Nov, 2022

健康相关社交对话中信息查询事件的特征化

通过事件的视角，本文提出了一种用于表征社交话语中与健康相关的信息搜寻的范例。利用 Reddit 帖子进行案例研究，以药物治疗 Opioid Use Disorder (OUD) 为例，建立了 TREAT-ISE 数据集，该数据集包含基于不同事件类型进行注释的 OUD 社交话语中的信息搜寻事件。并借助多个机器学习和深度学习分类器，建立了一个强大的性能基准（77.4% F1 score），并深入研究了 ChatGPT 在这一任务上的表现和错误，提供了有价值的见解和持续的表征工作。

Aug, 2023

迈向更安全的运营：一个专家参与的高压气体事故数据集，以预防未来故障

本文介绍了一个新的安全预防的 IncidentAI 数据集，与通常只包含单个任务的先前的语料库不同，我们的数据集包括三个任务：命名实体识别、因果关系提取和信息检索。该数据集由至少有六年实践经验的高压气体保护管理员领域的专家进行标注。我们验证了数据集在安全预防场景中的贡献。三个任务的初步结果显示，自然语言处理技术有助于分析事故报告以预防未来的故障。该数据集促进了自然语言处理和事故管理社区的未来研究。同时提供对数据集的访问（IncidentAI 数据集的访问链接：https:// 此处放置链接）。

Oct, 2023

使用模板评估不良药物事件分类模型的鲁棒性

对英语语言环境中不良药物效应（ADE）检测进行手工模板的全面性能评估，发现在社交媒体中检测 ADE 的模型能力存在差异。

Jul, 2024