基于疾病概念的生物医学文档聚类与可视化
本研究提出了一种基于深度学习的自动化主题注解细化方法,通过在文章摘要中的概念出现来进行弱监督,发现概念出现是自动化主题注解细化的强有力依据,还可以与基于字典的启发式算法相结合以进一步提高准确率。
Jan, 2023
本文报告了一种在生物医学和临床文本领域中进行词义消歧的基于知识的方法。我们结合大规模语料库上创建的词表示和来自 UMLS 的少量定义创建概念表示,然后将其与含糊术语上下文的表示进行比较。使用无关系信息,我们在生物医学领域中已知的数据集(MSH-WSD 数据集)上获得了可比较的性能。此外,我们的方法快速、易于设置和扩展到其他领域。
Aug, 2016
本文介绍了一种基于疾病词汇的 word2vec 模型(Dis2Vec),用于自动创建疾病分类法,以便更准确地进行疾病监测。结果表明,Dis2Vec 比传统方法更能准确地捕捉不同类别疾病的分类属性,并且性能更好。
Mar, 2016
本文提出了一种方法,通过使用 UMLS Metathesaurus 的结构信息对医学概念的分布上下文向量表示进行适应性改进,从而提高了链接概念之间向量表示的相似度,极大地提高了自动化方法的性能。
Sep, 2017
通过自动化方法将新概念放入知识库,提出基于 MedMentions 数据集的新基准来解决既定数据集常见的问题,并通过最近的大型语言模型方法进行评估。
Jun, 2023
本篇研究提出了 BioConceptVec,通过利用最先进的文本挖掘工具和机器学习模型学习 PubMed 摘要中介绍的超过 400,000 个生物概念的向量表示(即嵌入),来捕捉相关概念的语义。BioConceptVec 已经在包括 9 个不同生物数据集的 2500 万实例的多个生物信息学任务中得到了全面评估,在所有任务中其性能均优于现有方法。最后,BioConceptVec 通过网站免费向研究社区和公众提供。
Dec, 2019
使用大规模多模态医疗数据集,本文提出了一种新的 cui2vec 医疗概念词嵌入模型,并通过统计功率法进行了评估,结果表明该模型在大多数情况下相对于之前的方法具有最先进的性能。
Apr, 2018
本研究提出了一种基于电子病历数据的的 Med2Vec 方法,通过学习医学代码和访问的分布式表示形式,利用序列访问顺序和访问内部代码的共现关系提供临床医生可验证的基础, 在关键医学应用中显示出与流行基线(如 Skip-gram、GloVe 和堆叠自动编码器)相比的显着改进。
Feb, 2016
本研究采用 Word2Vec 深度学习工具对医学语料库进行了测试,以验证其在未结构化文本中识别关系的潜力,结果表明 Word2Vec 的排名生成和检索结果质量不足以用于知识库自动填充,但可作为手动筛选的起点。
Feb, 2015