GPT-3.5 能否生成和编码出院小结?
通过利用 GPT-3 作为算法骨干并采用低样本学习和集成方法,我们介绍了一种算法来创建合成训练数据,以明确关注捕捉医学相关信息,结果相当于采用 6400 个人标记的示例,能够制作出高质量的摘要,就医学准确性和连贯性而言,这种方法产生的摘要明显优于单纯使用人工标记数据进行训练的模型生成的摘要。
Sep, 2021
该研究提出了一种多模态机器学习模型,用于预测 ICD-10 诊断代码,并通过集成不同模态的机器学习模型和提取关键证据来增强预测的可信度和可解释性。在解释性方面,该方法在文本数据上达到了 0.1806 的 Jaccard 相似系数,在表格数据上达到了 0.3105。
Oct, 2018
利用大型预训练生成语言模型开发出零样本和少样本编码分配的实用解决方案,通过信息提取,利用 ICD 本体论和专业临床编码任务描述,检索相关提及,并利用 GPT-4 在第二阶段进行元细化,实现了自动 ICD 编码的方法,无需任务特定的学习,而在更稀缺的类别上达到了最优的性能。
Oct, 2023
该研究系统地回顾了 2010 年至 2020 年间使用自然语言处理、机器学习和深度学习等方法来帮助医生更准确、高效地对患者病历进行编码的研究,其中共筛选出 38 篇符合条件的文献,并提出了未来的研究方向。
Jul, 2021
本研究旨在解决将多标签分类任务转变为自回归生成任务的长尾挑战,通过引入新颖的生成自由文本的预训练目标,生成低维度的文本描述,从而推断出 ICD 代码,实验结果表明我们所提出的模型实现了新的 SOTA 表现,并设计了一种新的交叉关注再排序器来集成先前的 SOTA 和我们最佳的少样本编码预测。
Nov, 2022
本文使用神经网络模型对医院出院总结报告进行自动摘要,结论表明以护理笔记为来源,离散化分离出院总结报告的各个部分作为目标输出来训练语言模型可以提高模型效率和文本质量。
May, 2023
本文使用专业医学人士对 GPT-3 生成的医学文章摘要进行了评估,发现 GPT-3 虽然能够忠实地总结和简化单篇生物医学文章,但在多篇文章发现的证据综合方面存在困难。
May, 2023
本文研究提出一种新的文本数据增强方法,利用 GPT-2 生成病人电子病历中的临床记录作为额外的训练数据,用于预测病人的不良预后,实验证明了该数据增强方法的有效性。
Nov, 2022
本研究旨在利用最先进的语言模型对 MIMIC-IV 数据集中的 “病历简况” 和 “出院指示” 部分进行自动生成,以减轻临床医生的行政工作负担。我们研究了自动化如何提高文档准确性、缓解临床医生过劳并提升医疗机构的运营效率。在本次 BioNLP @ ACL 2024 的共享任务 Discharge Me! 中,我们采用了各种策略,包括少样本学习、指令调优和动态专家选择 (DES),以开发能够生成所需文本部分的模型。值得注意的是,利用额外的临床领域特定数据集展示了提升临床语言处理的巨大潜力。DES 方法通过优化从多个预测中选择文本输出的方式,证明其特别有效。在比赛中,DES 方法获得了最高的综合得分为 0.332,超过了单一模型的输出。这一发现表明,先进的深度学习方法与 DES 结合,可以有效地自动化电子病历的部分文档化。这些进展有望通过释放临床医生的时间用于病人互动,提升患者护理水平。文本选择策略的整合代表了进一步研究的有希望途径。
May, 2024
本研究评估了 GPT-3.5、GPT-4、Falcon 和 LLaMA 2 等最先进的大型语言模型在从出院摘要中识别患有轻度认知障碍(MCI)的患者的能力,并检查模型响应与其推理不一致的情况。研究结果强调了提示工程的重要性和对 GPT-4 中观察到的意外推理 - 响应不一致性进一步探索的需求,突显了将大型语言模型应用于医疗诊断的潜力,前提是在方法论上取得进步以确保人工智能生成的输出准确性和临床连贯性,从而提高大型语言模型在医疗决策中的可信度。
Dec, 2023