组合药物治疗的端到端 $n$ 元关系抽取
为了帮助医生识别有效的药物联合治疗方案,我们构建了一个专家注释的数据集,用于从科学文献中提取药物联合治疗方案的疗效信息。除了实际应用之外,该数据集还提出了一个独特的 NLP 挑战,作为第一个由可变长度关系组成的关系提取数据集,这种数据集中的关系主要需要超越句子级别的语言理解,增加了此任务的挑战性。我们提供了一个有前途的基线模型,并确定了进一步改进的明显领域。我们公开发布我们的数据集、代码和基线模型,以促进 NLP 社区参与该任务。
May, 2022
该文介绍了一种文本挖掘框架,利用 Named Entity Recognition 和 Relation Extraction 模型对医学文献和数字临床记录进行处理,取得优异的实验结果,并构建了一个生物医学知识图谱。系统使用 Spark NLP 库提供的生产级、可伸缩、硬件优化、可训练和可调整的 NLP 框架。
Dec, 2021
本文提出了一种新颖的多尺度神经架构,以文档级别的 $n$ 元关系提取为目标,通过整合文档中各种文本跨度上的学习表征和子关系层次间的信息,扩大了系统的视野,增加了召回率和精确度,并在生物医学机器阅读上实验验证优于先前的 $n$ 元关系抽取方法。
Apr, 2019
本研究提出了一种深度学习方法,利用单词级和句子级表示同时提取治疗和问题之间的关系,以用于医疗决策支持系统、安全监测和新治疗发现。通过深度学习和基于规则的模型的联合结果获得了最终的关联关系。该系统在 I2b2 2010 关系提取任务的关系类别上取得了有前途的表现。
Jun, 2018
本研究通过使用基于跨度的管道方法,在 ChemProt 数据集上获得了新的最先进的 E2ERE(端到端关系提取)性能,结果比先前的最佳结果提高了 $> 4%$,结果表明简单的细粒度标记化方案有助于跨度方法在 E2ERE 中表现优异,特别是对于处理复杂命名实体。
Apr, 2023
该研究为解决多药副作用识别、药物间相互作用预测和联合疗法设计任务提供了一种统一的关系机器学习模型的理论视角,讨论了现有模型架构、性能指标、数据集和评估协议,强调了在该领域中可能的高影响应用和重要的未来研究方向。
Nov, 2021
该论文探讨了如何利用异构领域信息来提高文献中关系抽取的性能,并针对药物间关系进行了实例研究,实现了神经关系抽取模型和知识图谱相结合的方法。
Dec, 2022
探索了 MedTem 项目中利用深度学习和大型语言模型(LLM)进行医疗信息从 EMR 中提取和分类的效果,并对不同字嵌入技术进行了研究。在医疗实体识别任务中,CNN-BiLSTM 模型优于 BiLSTM-CRF 模型,分别达到了 75.67,77.83 和 78.17 的 Macro Average 精确度,召回率和 F1 分数。BERT-CNN 模型在 i2b2-2012 挑战的时间关系提取测试集上表现也较好,分别达到了 64.48,67.17 和 65.03 的 Macro Average P/R/F1 分数。
Oct, 2023
本文提出了三种基于长短时记忆网络(LSTM)的模型,包括 B-LSTM、AB-LSTM 和 Joint AB-LSTM,利用词语和位置嵌入作为潜在特征,不依赖于显式特征工程,其中 Joint AB-LSTM 模型表现最佳,优于现有的所有方法,包括那些依赖于人工特征的方法,另外两个模型也表现出色。该模型旨在解决药物相互作用(DDI)的提取问题,更有效和高效的解决 DDI 问题是非常重要的。
Jan, 2017
本文介绍了一种增强生物医学文本中关系抽取的方法,重点关注化学基因相互作用。利用 BioBERT 模型和多层全连接网络架构,我们的方法使用一种新颖的合并策略,将 ChemProt 和 DrugProt 数据集集成在一起。通过大量实验,我们证明了显著的性能提升,特别是在数据集之间共享的 CPR 组。研究结果强调了数据集合并在增加样本数量和提高模型准确性方面的重要性。此外,该研究突显了自动化信息提取在生物医学研究和临床实践中的潜力。
May, 2024