组合药物治疗的端到端 $n$ 元关系抽取

Mar, 2023

组合药物治疗的端到端 $n$ 元关系抽取

End-to-End $n$-ary Relation Extraction for Combination Drug Therapies

Yuhang Jiang, Ramakanth Kavuluru

TL;DR本论文基于 sequence-to-sequence style 的 end-to-end extraction 方法，以 CombDrugExt 数据集为基础，实现了普遍疾病中复方药物的关系提取，F1-Score 为 66.7%。

Abstract

combination drug therapies are treatment regimens that involve two or more drugs, administered more commonly for patients with cancer, HIV, malaria, or tuberculosis. Currently there are over 350K articles in PubMed that use the "combination drug therapy" MeSH heading with at least 10K

combination drug therapies relation extraction end-to-end extraction drug entities dynamic n-ary extraction

发现论文，激发创造

药物组合 N 元关系抽取数据集

为了帮助医生识别有效的药物联合治疗方案，我们构建了一个专家注释的数据集，用于从科学文献中提取药物联合治疗方案的疗效信息。除了实际应用之外，该数据集还提出了一个独特的 NLP 挑战，作为第一个由可变长度关系组成的关系提取数据集，这种数据集中的关系主要需要超越句子级别的语言理解，增加了此任务的挑战性。我们提供了一个有前途的基线模型，并确定了进一步改进的明显领域。我们公开发布我们的数据集、代码和基线模型，以促进 NLP 社区参与该任务。

May, 2022

关系抽取在临床文档理解中的应用

该文介绍了一种文本挖掘框架，利用 Named Entity Recognition 和 Relation Extraction 模型对医学文献和数字临床记录进行处理，取得优异的实验结果，并构建了一个生物医学知识图谱。系统使用 Spark NLP 库提供的生产级、可伸缩、硬件优化、可训练和可调整的 NLP 框架。

Dec, 2021

多尺度表示学习在文档级 N 元关系抽取中的应用

本文提出了一种新颖的多尺度神经架构，以文档级别的 $n$ 元关系提取为目标，通过整合文档中各种文本跨度上的学习表征和子关系层次间的信息，扩大了系统的视野，增加了召回率和精确度，并在生物医学机器阅读上实验验证优于先前的 $n$ 元关系抽取方法。

Apr, 2019

一种用深度学习实现医疗关系抽取的混合方法

本研究提出了一种深度学习方法，利用单词级和句子级表示同时提取治疗和问题之间的关系，以用于医疗决策支持系统、安全监测和新治疗发现。通过深度学习和基于规则的模型的联合结果获得了最终的关联关系。该系统在 I2b2 2010 关系提取任务的关系类别上取得了有前途的表现。

Jun, 2018

化学蛋白相互作用提取的端到端模型：更好的标记和基于跨度的流水线策略

本研究通过使用基于跨度的管道方法，在 ChemProt 数据集上获得了新的最先进的 E2ERE（端到端关系提取）性能，结果比先前的最佳结果提高了 $> 4％$，结果表明简单的细粒度标记化方案有助于跨度方法在 E2ERE 中表现优异，特别是对于处理复杂命名实体。

Apr, 2023

药物对打分的关系深度学习统一视图

该研究为解决多药副作用识别、药物间相互作用预测和联合疗法设计任务提供了一种统一的关系机器学习模型的理论视角，讨论了现有模型架构、性能指标、数据集和评估协议，强调了在该领域中可能的高影响应用和重要的未来研究方向。

Nov, 2021

将异构领域信息集成到关系抽取中：基于药物相互作用抽取的案例研究

该论文探讨了如何利用异构领域信息来提高文献中关系抽取的性能，并针对药物间关系进行了实例研究，实现了神经关系抽取模型和知识图谱相结合的方法。

Dec, 2022

利用不同深度学习模型从临床文本中提取药物及时序关系

探索了 MedTem 项目中利用深度学习和大型语言模型（LLM）进行医疗信息从 EMR 中提取和分类的效果，并对不同字嵌入技术进行了研究。在医疗实体识别任务中，CNN-BiLSTM 模型优于 BiLSTM-CRF 模型，分别达到了 75.67，77.83 和 78.17 的 Macro Average 精确度，召回率和 F1 分数。BERT-CNN 模型在 i2b2-2012 挑战的时间关系提取测试集上表现也较好，分别达到了 64.48，67.17 和 65.03 的 Macro Average P/R/F1 分数。

Oct, 2023

利用长短时记忆网络从生物医学文本中提取药物相互作用

本文提出了三种基于长短时记忆网络（LSTM）的模型，包括 B-LSTM、AB-LSTM 和 Joint AB-LSTM，利用词语和位置嵌入作为潜在特征，不依赖于显式特征工程，其中 Joint AB-LSTM 模型表现最佳，优于现有的所有方法，包括那些依赖于人工特征的方法，另外两个模型也表现出色。该模型旨在解决药物相互作用（DDI）的提取问题，更有效和高效的解决 DDI 问题是非常重要的。

Jan, 2017

基于 BioBERT 的深度学习和融合的 ChemProt-DrugProt 方法用于增强的生物医学关系抽取

本文介绍了一种增强生物医学文本中关系抽取的方法，重点关注化学基因相互作用。利用 BioBERT 模型和多层全连接网络架构，我们的方法使用一种新颖的合并策略，将 ChemProt 和 DrugProt 数据集集成在一起。通过大量实验，我们证明了显著的性能提升，特别是在数据集之间共享的 CPR 组。研究结果强调了数据集合并在增加样本数量和提高模型准确性方面的重要性。此外，该研究突显了自动化信息提取在生物医学研究和临床实践中的潜力。

May, 2024