使用出院总结的自动 ICD 编码和分类系统的系统性文献综述
利用大型预训练生成语言模型开发出零样本和少样本编码分配的实用解决方案,通过信息提取,利用 ICD 本体论和专业临床编码任务描述,检索相关提及,并利用 GPT-4 在第二阶段进行元细化,实现了自动 ICD 编码的方法,无需任务特定的学习,而在更稀缺的类别上达到了最优的性能。
Oct, 2023
本文提出了一种具有注意力机制的分层深度学习模型,该模型可以根据诊断描述自动分配 ICD 诊断代码。实验结果表明,我们的深度学习模型能够在合理的范围内自动编码,并为计算机辅助 ICD 编码提供了框架。
Nov, 2017
本文介绍了四种模型来自动给出患者摘要的多个 ICD 诊断编码,其中介绍了一种基于分层注意力 GRU(HA-GRU)的分层标签文档方法,其实现了最先进的结果,并且通过学习的句子级注意力层突显了模型的决策过程和为未来的改进提出了建议。
Sep, 2017
通过研究调查临床记录的半结构化性质,我们提出了一种自动算法将其分割为不同的部分。为了解决现有 ICD 编码模型在数据有限性方面的可变性问题,我们引入了对于部分使用基于树编辑距离的软多标签相似度度量的对比预训练方法。此外,我们设计了一个掩码部分训练策略,使 ICD 编码模型能够定位与 ICD 编码相关的部分。广泛的实验结果表明,我们提出的训练策略有效地提升了现有 ICD 编码方法的性能。
Oct, 2023
评估人工及自动化临床编码的质量和一致性,对于改进直接护理、支持临床沟通和促进临床研究至关重要。比较人工和计算机生成的编码与标准值,结果表明人工稍微优于自动化编码,但二者在仅包含一个诊断的自由文本描述中表现更好。
Nov, 2023
本文使用神经网络模型对医院出院总结报告进行自动摘要,结论表明以护理笔记为来源,离散化分离出院总结报告的各个部分作为目标输出来训练语言模型可以提高模型效率和文本质量。
May, 2023
本研究阐述了自然语言处理技术在电子病历上的应用存在的挑战和限制,以及研究人员使用机器学习、深度学习等技术进行处理和信息提取的相关领域和方法。
Jun, 2023
该论文提出了一种可扩展的工作流程,在利用包括 NLP、AutoML 和 Clinician-in-the-Loop 机制在内的技术,从 EHR 的结构化和非结构化的文本记录中构建机器学习分类器来评估患者。在 MIMIC-III 数据集上进行的案例研究表明,该提议的工作流程在识别患有卵巢癌、肺癌、癌症恶病质和狼疮性肾炎等疾病的病人方面表现出更高的分类性能,并且可以发现更多的由编码问题所引起的未编码患者。
May, 2022
通过调整多个开源语言模型的输入上下文、解码算法以及模型的特定领域训练,我们的研究解决了医护人员日常工作中繁琐的临床文档编写问题,并以生成出院小结为例,得出了在目标部分之前依赖于出院小结内容的生成方法要更加有效,同时较小的编码 - 解码模型也能比基于解码的较大语言模型在此任务中表现得更好。我们团队(aehrc)的模型训练结果已公开提供。
Jul, 2024