用户生成文本中医学概念规范化的深度神经模型
本研究基于深度单妻神经网络模型,将实体及其语法变化的语义信息嵌入到嵌入向量中,以实现对大型参考集的新实体实现快速映射,并在挑战性的生物实体规范化数据集中证明了框架的有效性。
Nov, 2018
通过使用专有和开源的大型语言模型(LLMs)与生物医学研究中常用的多种基于规则的归一化系统相结合,提高实体归一化性能并消除了需要微调的需要。
May, 2024
本研究介绍了一种基于 BERT 的命名实体识别(NER)模型,一个深度学习规范化模块以及一个半监督聚类模块构建的框架,用于从社交媒体中提取与 COVID-19 相关的症状词典,并对其进行标准化,以减少在基于社交媒体的公共卫生研究中的关键词匹配信息检索约束。
Jun, 2023
本论文介绍了一种简单而有效的学习策略,利用目标本体的层次结构来增强分类和生成模型的概括能力,该策略在已见概念上具有最先进的性能,在未见概念上也具有一致的改进,并可实现高效的零 - shot 知识转移。
Oct, 2022
通过学习实体的同义词对,我们提出了一种用于临床文本标准化的方法,通过关联多个术语,从而显著减少训练数据和资源消耗,并引入了基于上下文和无上下文重排序技术进行实体消岐。在最大的 UMLS 标注数据集 Medmentions 上,我们的方法表现与现有的零样本和远程监督实体链接技术相当,在没有基于领域的训练的情况下。最后,我们证明了单纯的检索性能可能不足以作为评估指标,并引入了一种基于文章的定量和定性分析,揭示了实体链接方法的进一步洞察。
May, 2024
该研究通过使用机器翻译和词向量表示的技术,将社交媒体短语转化为医疗概念,从而监测社区中的健康情况,并在针对不良药物反应症状的推文集合上获得了高达 55%的性能提升。
Aug, 2015
文章提出了一种新颖的深度神经多任务学习框架,采用显式反馈策略联合建模识别和规范化任务,实现了一种将层次任务转化为并行的多任务设置,并保持任务之间的相互支持,从而显著提高了模型性能。实验证明,该方法在两个公开的医学文献数据集上的表现均显著优于现有方法。
Dec, 2018
本研究运用新的注释框架拟定临床实体抽取的评估标准,并发现现有的医学词汇一致性、数据标签限制、评估技术瓶颈等问题仍需要解决,因此提出了解决方案来推动临床实体识别和标准化的发展。
Jul, 2020
本文提出了一种无需手工规则的稳健便携候选实体生成方案,采用三元组网络用于疾病链接排名,实验结果表明我们的方法在标准基准 NCBI 疾病数据集上显著优于现有方法。
Dec, 2020
通过自动化方法将新概念放入知识库,提出基于 MedMentions 数据集的新基准来解决既定数据集常见的问题,并通过最近的大型语言模型方法进行评估。
Jun, 2023