生物医学关系抽取技术简述
本文介绍了关系抽取(RE)的若干重要的监督、半监督和无监督技术,以及开放信息抽取(OIE)和远程监督的范例,最后描述了近期 RE 技术和未来研究方向。这篇综述对于领域的新手、研究人员和实践者都有用。
Dec, 2017
使用不同的信息来源支持自动提取生物医学概念之间关系的研究,其中包括使用多通道架构深度神经网络对医学文献中的概念进行关系提取,同时将医学本体论结合进来可以进一步提高结果的准确性。
May, 2019
该文介绍了一种文本挖掘框架,利用 Named Entity Recognition 和 Relation Extraction 模型对医学文献和数字临床记录进行处理,取得优异的实验结果,并构建了一个生物医学知识图谱。系统使用 Spark NLP 库提供的生产级、可伸缩、硬件优化、可训练和可调整的 NLP 框架。
Dec, 2021
本研究提出了一种深度学习方法,利用单词级和句子级表示同时提取治疗和问题之间的关系,以用于医疗决策支持系统、安全监测和新治疗发现。通过深度学习和基于规则的模型的联合结果获得了最终的关联关系。该系统在 I2b2 2010 关系提取任务的关系类别上取得了有前途的表现。
Jun, 2018
在本研究中,采用使用深度学习方法和生物医学本体论,例如 Gene Ontology、Human Phenotype Ontology、Human Disease Ontology 和 Chemical Entities of Biological Interest,提高生物医学关系抽取方法,达到了比现有技术更高的精度。
Jan, 2020
利用大型语言模型的阅读理解能力和生物医学领域知识,开发了一个高通量的生物医学关系提取系统,将关系提取任务作为一个简单的二分类问题,通过外部语料库和世界知识进行判断,并从可靠医学网站中提取多种类型的生物医学关系。
Dec, 2023
本研究介绍比较了在构建知识图谱中用于从生物医学文献中提取关系方面的一些基于规则和基于机器学习的方法,例如:朴素贝叶斯、随机森林、DistilBERT、PubMedBERT、T5、SciFive 等,通过实验检测不同方法的适用性和鲁棒性。结果表明,基于 transformers 的模型(如 PubMedBERT)在处理小型和不平衡的数据时表现较好。其中,在平衡数据上,PubMedBERT 模型的 F1 得分最高(0.92)。
Jan, 2022
提出一种无需实体级别监督的实体链接和关系抽取模型,避免了流水线方法中产生的级联错误,并在两个生物医学数据集上优于最先进的实体链接和关系抽取流水线,极大地提高了系统的总体召回率。
Dec, 2019
本研究针对生物医学领域中关系抽取的挑战,提出利用知识图谱关系对原始文本进行自动标注,以克服标注数据缺乏的问题,并通过构建更为准确的基准集 “MedDistant19” 来解决现有基准集存在的一系列问题,并验证了其在领域中具有普遍适用性。
Apr, 2022