用户生成文本中医学概念规范化的深度神经模型

ACLJul, 2019

用户生成文本中医学概念规范化的深度神经模型

Deep Neural Models for Medical Concept Normalization in User-Generated Texts

Zulfat Miftahutdinov, Elena Tutubalina

TL;DR本文使用神经网络解决医学文本中的概念标准化问题，实验结果表明神经网络能够更好地识别实体，并获得更好的语义表示。

Abstract

In this work, we consider the medical concept normalization problem, i.e., the problem of mapping a health-related entity mention in a free-form text to a concept in a →

medical concept normalization health-related entity mention controlled vocabulary neural networks semantic representations

发现论文，激发创造

NSEEN：面向实体归一化的神经语义嵌入

本研究基于深度单妻神经网络模型，将实体及其语法变化的语义信息嵌入到嵌入向量中，以实现对大型参考集的新实体实现快速映射，并在挑战性的生物实体规范化数据集中证明了框架的有效性。

Nov, 2018

通用可扩展的多阶段生物医学概念标准化利用大型语言模型

通过使用专有和开源的大型语言模型（LLMs）与生物医学研究中常用的多种基于规则的归一化系统相结合，提高实体归一化性能并消除了需要微调的需要。

May, 2024

运用深度学习简化社交媒体信息检索，为公共卫生研究提供服务

本研究介绍了一种基于 BERT 的命名实体识别（NER）模型，一个深度学习规范化模块以及一个半监督聚类模块构建的框架，用于从社交媒体中提取与 COVID-19 相关的症状词典，并对其进行标准化，以减少在基于社交媒体的公共卫生研究中的关键词匹配信息检索约束。

Jun, 2023

针对医学术语标准化的长尾概念泛化

本论文介绍了一种简单而有效的学习策略，利用目标本体的层次结构来增强分类和生成模型的概括能力，该策略在已见概念上具有最先进的性能，在未见概念上也具有一致的改进，并可实现高效的零 - shot 知识转移。

Oct, 2022

高效的生物医学实体链接：低资源技术下的临床文本标准化

通过学习实体的同义词对，我们提出了一种用于临床文本标准化的方法，通过关联多个术语，从而显著减少训练数据和资源消耗，并引入了基于上下文和无上下文重排序技术进行实体消岐。在最大的 UMLS 标注数据集 Medmentions 上，我们的方法表现与现有的零样本和远程监督实体链接技术相当，在没有基于领域的训练的情况下。最后，我们证明了单纯的检索性能可能不足以作为评估指标，并引入了一种基于文章的定量和定性分析，揭示了实体链接方法的进一步洞察。

May, 2024

调整基于短语的机器翻译以标准化社交媒体信息中的医学术语

该研究通过使用机器翻译和词向量表示的技术，将社交媒体短语转化为医疗概念，从而监测社区中的健康情况，并在针对不良药物反应症状的推文集合上获得了高达 55％的性能提升。

Aug, 2015

一种神经多任务学习框架，联合建模医疗实体识别和归一化

文章提出了一种新颖的深度神经多任务学习框架，采用显式反馈策略联合建模识别和规范化任务，实现了一种将层次任务转化为并行的多任务设置，并保持任务之间的相互支持，从而显著提高了模型性能。实验证明，该方法在两个公开的医学文献数据集上的表现均显著优于现有方法。

Dec, 2018

临床实体提取机器学习的稳健基准测试

本研究运用新的注释框架拟定临床实体抽取的评估标准，并发现现有的医学词汇一致性、数据标签限制、评估技术瓶颈等问题仍需要解决，因此提出了解决方案来推动临床实体识别和标准化的发展。

Jul, 2020

使用三元组网络进行医疗实体链接

本文提出了一种无需手工规则的稳健便携候选实体生成方案，采用三元组网络用于疾病链接排名，实验结果表明我们的方法在标准基准 NCBI 疾病数据集上显著优于现有方法。

Dec, 2020

从文本中丰富本体学：一个用于概念发现和定位的生物医学数据集

通过自动化方法将新概念放入知识库，提出基于 MedMentions 数据集的新基准来解决既定数据集常见的问题，并通过最近的大型语言模型方法进行评估。

Jun, 2023