临床放射肿瘤学中的自然语言处理技术和框架简介
该研究系统评估了最近NLP应用于放射学报告方面的文献,并将其归类为6个临床应用类别,结果表明,深度学习的使用在增加,但传统的机器学习方法仍然普遍存在。
Feb, 2021
本文介绍了使用自然语言处理技术和基于深度学习的方法处理医学记录中的实际数据,通过利用医学注册处重点患者信息的导向监督,并结合领域特定的预训练、递归神经网络和分层注意的方法,实现了在医疗系统中具有可伸缩性的实证研究。
Mar, 2022
本研究阐述了自然语言处理技术在电子病历上的应用存在的挑战和限制,以及研究人员使用机器学习、深度学习等技术进行处理和信息提取的相关领域和方法。
Jun, 2023
在本研究中,我们采用八个大型语言模型,在六个数据集和四个不同的摘要任务(放射学报告、患者问题、进展记录和医生-患者对话)上应用领域适应方法,系统评估了它们的效果,而且展示出最佳适应的大型语言模型的摘要相较于人工摘要在完整性和正确性方面更可取。此外,我们还将传统的自然语言处理指标与医生评分进行了相关性分析,以提高对这些指标与医生喜好的理解。最终,我们的研究证明了大型语言模型在多个临床文本摘要任务中超越人工专家,这意味着将大型语言模型整合到临床工作流程中可以减轻文档负担,使临床医生能够更多关注个性化患者护理和其他医学中不可替代的人工环节。
Sep, 2023
使用大型语言模型(LLMs)结合人类专家的方法,快速生成医疗文本注释的地面真实标签,从而减少人工注释负担并保持高准确性,为医疗健康领域的定制自然语言处理(NLP)解决方案提供了潜力。
Dec, 2023
我们提供了放射治疗自然语言处理数据库(ROND),这是放射治疗领域的首个专用NLP数据集,旨在为该领域的研究和发展提供专门设计的数据集和基准。ROND涵盖了多种NLP任务,包括逻辑推理、文本分类、命名实体识别(NER)、问答(QA)、文本摘要和患者-临床医师对话,每种任务都对放射治疗概念和应用案例有着明确的关注点。此外,我们还通过基于ROND的20k指令对数据集开展了调整,并训练了一个大型语言模型CancerChat,以展示在高度专业化的医疗领域中指令调整大型语言模型的潜力。本研究的评估结果可为未来研究提供基准结果。ROND旨在为放射治疗和临床NLP的进展提供一个测试和改进算法和模型的领域特定上下文的平台。ROND数据集是多个美国卫生机构的联合工作。数据可在以下URL获得:
Jan, 2024
使用Langchain提示工程流程,Fine-tune 基于临床数据和临床指南文本语料库的先进OpenAI模型,实现了对乳腺癌患者的辅助放疗和化疗的高准确率(0.85+)分类。通过从人类肿瘤学家的观察数据建立信心区间,估计模型必须在治疗预测中超过原始肿瘤学家的比例为8.2%至13.3%。尽管肿瘤治疗决策结果的不确定性,但未来研究,可能是临床试验,需要确定这一阈值是否被模型满足。然而,因为85%的美国癌症患者在本地社区设施接受治疗,这些模型在扩大获取质量护理的同时,最小程度上接近人类肿瘤学家将发挥重要作用。
Jun, 2024
该研究提出了CancerLLM模型,该模型具有70亿个参数和Mistral风格的架构,预先训练了2,676,642份临床笔记和515,524份病理报告,涵盖了17种癌症类型,并在三个与癌症相关的任务上进行了微调,包括癌症表型提取、癌症诊断生成和癌症治疗计划生成。评估结果表明,CancerLLM相对于其他现有的语言模型取得了最先进的结果,平均F1得分提高了8.1%。此外,CancerLLM在两个提出的鲁棒性测试中表现优于其他模型,这表明CancerLLM可以有效应用于临床AI系统,增强了癌症领域的临床研究和医疗服务。
Jun, 2024
本综述旨在分析自然语言处理(NLP)技术在癌症研究中使用电子健康记录(EHR)和临床笔记的应用,填补现有文献中的空白。研究结果显示,NLP在癌症研究中的应用逐渐增多,尤其在乳腺癌、肺癌和结直肠癌领域,表明转向先进的机器学习技术是关键发现。未来的研究应致力于提高模型的通用性和临床应用整合。
Oct, 2024