文章综述了自然语言处理在电子健康记录领域的应用,重点介绍了计算表型学方法,包括基于关键词搜索和基于规则的系统等算法,以及监督式机器学习模型、深度学习和非监督式学习等最近受到关注的算法。同时文章指出在病历中特征关系的处理、模型可解释性和推广性等方面仍有待解决的问题。
Jun, 2018
介绍了一种开源的医学概念注释工具(MedCAT),该工具使用自我监督的机器学习算法从电子医疗记录中提取UMLS/SNOMED-CT概念,从而实现了对大量结构化文本的临床分析。该工具包括:自定义和训练IE模型的功能丰富的注释界面;以及与CogStack生态系统的集成用于厂商无关的卫生系统部署。现实世界的验证表明,该工具在大型伦敦医院的SNOMED-CT提取方面的性能表现很好,表明了跨领域的EHR-agnostic实用性,可加速临床和研究用例。
Oct, 2020
本文综述了当前神经自然语言处理方法在电子病历应用中的广泛运用,包括分类和预测,词嵌入,提取,生成以及其他诸如问答、表型、知识图谱、医学对话、多语言性和可解释性等领域。
Jul, 2021
本文介绍了EHRKit python库,该库包含两个主要部分,MIMIC-III特定功能和任务特定功能,通过访问MIMIC-III NOTEEVENTS数据并整合多个第三方库,以处理包括实体识别、文本摘要、机器翻译等12个NLP任务的临床文本。
Apr, 2022
本研究使用自然语言处理技术,比较了深度学习模型和手动工程化语言特征模型,在使用自由文本格式预测急性护理使用风险上的表现,结果表明,使用结构化健康数据模型能够最小限度地胜过NLP模型。
Sep, 2022
使用大型语言模型(LLMs)结合人类专家的方法,快速生成医疗文本注释的地面真实标签,从而减少人工注释负担并保持高准确性,为医疗健康领域的定制自然语言处理(NLP)解决方案提供了潜力。
Dec, 2023
电子健康记录(EHRs)是数据驱动型医学研究的宝贵资源,而去识别(即去除个人健康信息)是使EHR数据可供研究目的共享的关键步骤。本研究系统审查了过去13年临床自由文本去识别的发展,并报告了目前最先进系统的性能和局限性,并识别了该领域的挑战和研究机会。
Nov, 2023
医疗环境中存在大量且多样化的数据,然而仅有少部分文本化电子健康数据被处理和解释,这导致了大数据操作的困难,研究致力于分析医疗领域的术语、自然语言处理和深度学习技术,以期提出相关解决方案。
Jan, 2024
通过自然语言处理技术,使用强调和带有偏见的语言的特征在重症监护电子病历中进行检测和分类。
May, 2024
本综述旨在分析自然语言处理(NLP)技术在癌症研究中使用电子健康记录(EHR)和临床笔记的应用,填补现有文献中的空白。研究结果显示,NLP在癌症研究中的应用逐渐增多,尤其在乳腺癌、肺癌和结直肠癌领域,表明转向先进的机器学习技术是关键发现。未来的研究应致力于提高模型的通用性和临床应用整合。
Oct, 2024