使用出院总结的自动 ICD 编码和分类系统的系统性文献综述

Jul, 2021

使用出院总结的自动 ICD 编码和分类系统的系统性文献综述

A Systematic Literature Review of Automated ICD Coding and Classification Systems using Discharge Summaries

Rajvir Kaur, Jeewani Anupama Ginige, Oliver Obst

TL;DR该研究系统地回顾了 2010 年至 2020 年间使用自然语言处理、机器学习和深度学习等方法来帮助医生更准确、高效地对患者病历进行编码的研究，其中共筛选出 38 篇符合条件的文献，并提出了未来的研究方向。

Abstract

Codification of free-text clinical narratives have long been recognised to be beneficial for secondary uses such as funding, insurance claim processing and research. The current scenario of assigning codes is a manual process which is very expensive, time-consuming and error prone. In recent years, many researchers have studied the use of →

natural language processing machine learning deep learning automated clinical coding systems icd code assignment

发现论文，激发创造

通过自动弱监督分类非结构化临床笔记

该研究介绍了一种利用机器学习和文本分类方法来自动识别医疗记录中的疾病编码 (ICD) 的框架，而不需要使用任何人工标记文档。

Jun, 2022

利用现成大型语言模型进行自动临床编码

利用大型预训练生成语言模型开发出零样本和少样本编码分配的实用解决方案，通过信息提取，利用 ICD 本体论和专业临床编码任务描述，检索相关提及，并利用 GPT-4 在第二阶段进行元细化，实现了自动 ICD 编码的方法，无需任务特定的学习，而在更稀缺的类别上达到了最优的性能。

Oct, 2023

利用深度学习实现自动化 ICD 编码

本文提出了一种具有注意力机制的分层深度学习模型，该模型可以根据诊断描述自动分配 ICD 诊断代码。实验结果表明，我们的深度学习模型能够在合理的范围内自动编码，并为计算机辅助 ICD 编码提供了框架。

Nov, 2017

基于患者笔记的多标签分类：以 ICD 编码分配为例的案例研究

本文介绍了四种模型来自动给出患者摘要的多个 ICD 诊断编码，其中介绍了一种基于分层注意力 GRU（HA-GRU）的分层标签文档方法，其实现了最先进的结果，并且通过学习的句子级注意力层突显了模型的决策过程和为未来的改进提出了建议。

Sep, 2017

基于树型对比学习的半结构化自动 ICD 编码研究

通过研究调查临床记录的半结构化性质，我们提出了一种自动算法将其分割为不同的部分。为了解决现有 ICD 编码模型在数据有限性方面的可变性问题，我们引入了对于部分使用基于树编辑距离的软多标签相似度度量的对比预训练方法。此外，我们设计了一个掩码部分训练策略，使 ICD 编码模型能够定位与 ICD 编码相关的部分。广泛的实验结果表明，我们提出的训练策略有效地提升了现有 ICD 编码方法的性能。

Oct, 2023

探索医院门诊信件中自由文本诊断的手工和自动编码的一致性、质量和挑战

评估人工及自动化临床编码的质量和一致性，对于改进直接护理、支持临床沟通和促进临床研究至关重要。比较人工和计算机生成的编码与标准值，结果表明人工稍微优于自动化编码，但二者在仅包含一个诊断的自由文本描述中表现更好。

Nov, 2023

电子健康档案的神经摘要

本文使用神经网络模型对医院出院总结报告进行自动摘要，结论表明以护理笔记为来源，离散化分离出院总结报告的各个部分作为目标输出来训练语言模型可以提高模型效率和文本质量。

May, 2023

电子病历中的自然语言处理与医疗决策：一项系统性综述

本研究阐述了自然语言处理技术在电子病历上的应用存在的挑战和限制，以及研究人员使用机器学习、深度学习等技术进行处理和信息提取的相关领域和方法。

Jun, 2023

基于医生参与的可扩展工作流程，构建机器学习分类器以识别特定疾病患者

该论文提出了一种可扩展的工作流程，在利用包括 NLP、AutoML 和 Clinician-in-the-Loop 机制在内的技术，从 EHR 的结构化和非结构化的文本记录中构建机器学习分类器来评估患者。在 MIMIC-III 数据集上进行的案例研究表明，该提议的工作流程在识别患有卵巢癌、肺癌、癌症恶病质和狼疮性肾炎等疾病的病人方面表现出更高的分类性能，并且可以发现更多的由编码问题所引起的未编码患者。

May, 2022

2024 年 “出院我” 电子健康 CSIRO: 用精细调整的语言模型生成出院小结部分

通过调整多个开源语言模型的输入上下文、解码算法以及模型的特定领域训练，我们的研究解决了医护人员日常工作中繁琐的临床文档编写问题，并以生成出院小结为例，得出了在目标部分之前依赖于出院小结内容的生成方法要更加有效，同时较小的编码 - 解码模型也能比基于解码的较大语言模型在此任务中表现得更好。我们团队（aehrc）的模型训练结果已公开提供。

Jul, 2024