生成精准忠实的出院指导:任务、数据集和模型
本研究旨在利用最先进的语言模型对 MIMIC-IV 数据集中的 “病历简况” 和 “出院指示” 部分进行自动生成,以减轻临床医生的行政工作负担。我们研究了自动化如何提高文档准确性、缓解临床医生过劳并提升医疗机构的运营效率。在本次 BioNLP @ ACL 2024 的共享任务 Discharge Me! 中,我们采用了各种策略,包括少样本学习、指令调优和动态专家选择 (DES),以开发能够生成所需文本部分的模型。值得注意的是,利用额外的临床领域特定数据集展示了提升临床语言处理的巨大潜力。DES 方法通过优化从多个预测中选择文本输出的方式,证明其特别有效。在比赛中,DES 方法获得了最高的综合得分为 0.332,超过了单一模型的输出。这一发现表明,先进的深度学习方法与 DES 结合,可以有效地自动化电子病历的部分文档化。这些进展有望通过释放临床医生的时间用于病人互动,提升患者护理水平。文本选择策略的整合代表了进一步研究的有希望途径。
May, 2024
通过调整多个开源语言模型的输入上下文、解码算法以及模型的特定领域训练,我们的研究解决了医护人员日常工作中繁琐的临床文档编写问题,并以生成出院小结为例,得出了在目标部分之前依赖于出院小结内容的生成方法要更加有效,同时较小的编码 - 解码模型也能比基于解码的较大语言模型在此任务中表现得更好。我们团队(aehrc)的模型训练结果已公开提供。
Jul, 2024
我们提出了一种方法来通过从电子健康记录(EHR)中提取相关部分并添加解释性提示来生成 “Brief Hospital Course” 和 “Discharge Instructions” 段落,从而减少医生在写入详细笔记方面所需的时间和工作量。我们的方法在 ClinicalT5-large 模型上进行了 LoRA 微调来训练文本生成模型,在最终测试数据中实现了 0.394 的 ROUGE-1 得分,与顶级解决方案相当。
Jun, 2024
利用 Llama3 8B 量化模型和检索增强生成(RAG)方法生成病人出院信中的 “简要医院病程” 和 “出院指示” 节,结果表明我们的方法在多个评估指标上取得了高效且有效的结果。
May, 2024
EHRTutor 是一个创新的多组件框架,利用大型语言模型(LLM)通过对话问答为患者教育提供了电子健康记录出院指示,评估结果表明 EHRTutor 在 LLMs 和领域专家中都表现出明显优势,并且 EHRTutor 还提供了一个从事后系统训练的未来内部系统的框架。
Oct, 2023
本文使用神经网络模型对医院出院总结报告进行自动摘要,结论表明以护理笔记为来源,离散化分离出院总结报告的各个部分作为目标输出来训练语言模型可以提高模型效率和文本质量。
May, 2023
本文介绍了 Discharge Summary Clinical Questions(DiSCQ)这一新的数据集,由 100 多个 MIMIC-III 出院摘要中的医学专家生成了 2000 多个问题。我们进行了基于触发词检测的质量评估,发现在 62% 的情况下,基线模型能够高质量地生成问题,并用无监督的答案检索对其进行配对。这项研究的目的是为了进一步研究现实临床问答和问句生成。
Jun, 2022
该研究旨在通过临床文本的预测,预防医生忽略潜在风险并帮助医院规划能力。使用语言模型分析预测诊断结果、手术、住院死亡率和住院时间。提出了临床结局预训练来整合多个公共来源的患者结局知识,并提出了一种将 ICD 编码层次结构纳入模型的简单方法,以提高模型的性能和可迁移性,同时也揭示了模型的一些缺陷。
Feb, 2021