使用大规模多模态医疗数据集,本文提出了一种新的 cui2vec 医疗概念词嵌入模型,并通过统计功率法进行了评估,结果表明该模型在大多数情况下相对于之前的方法具有最先进的性能。
Apr, 2018
该研究使用分布语义学将结构化知识图谱与非结构化文本相结合,利用概率生成模型预测医学概念之间的新关系,进一步证明该方法可用于医学领域的数据稀缺性问题。
Feb, 2016
本研究提出一个基于领域特定词汇上下文嵌入的临床问题、治疗和测试自动标注临床笔记的模型,使用上下文嵌入模型训练一个双向 LSTM-CRF 模型用于临床概念提取,并在 I2B2 2010 挑战数据集上进行了测试,最终性能优于现有模型 3.4%。
Oct, 2018
本研究使用连续词袋模型和注意力机制以及加入时间信息的方法进行医疗代码嵌入,实验结果表明该方法明显优于五种现有的基准模型。
Jun, 2018
本研究提出了一种概念感知的无监督用户嵌入方法,结合来自 MIMIC-III 和 Diabetes 两个临床语料库的文本文档和医学概念,用于疾病诊断和病人特征研究等领域,实验证明该方法的性能明显优于现有的无监督方法。
Mar, 2022
通过自动创建的大规模医学术语相似性数据集,我们证实了当代嵌入向量对于医疗术语的语义相似性表达受到限制,并提出了具有挑战性的新的基准数据集,以便开发能够准确表示整个医学术语的医学嵌入向量。
Mar, 2020
本文使用神经网络解决医学文本中的概念标准化问题,实验结果表明神经网络能够更好地识别实体,并获得更好的语义表示。
Jul, 2019
本研究旨在研究新的语言表示方法(如 ELMo,BERT)在医疗概念提取方面的应用,比较这些方法与传统词嵌入方法(word2vec,GloVe,fastText)的性能表现,并探讨将这些表示方法应用于医疗任务的可能性。研究结果表明,基于大型医学语料库的上下文嵌入方法表现出色,优于现有所有方法。此外,与传统词表示相比,上下文嵌入方法还包含有价值的语义信息。
Feb, 2019
本文介绍了一种新的自然语言处理应用,用于从电子病历注释中识别医学术语中的专业词汇,提出了一种新的医学术语提取模型 $MedjEx$,应用了辅助的 Wikipedia 超链接跨度数据集进行训练,并使用该模型提高了生物医学命名实体识别基准数据集的表现。
Oct, 2022
通过使用手工创建的概念映射工具 MetaMapLite,从 PubMed 和 PMC 生成额外的伪标注数据来增强有限的训练数据,本研究通过广泛的实验展示了通过训练一个更好的概念提取模型来解决生物医学概念提取任务中的数据稀缺和概念与其标准名称偏离的问题。
Jul, 2024