该研究针对医疗领域中的自然语言处理技术应用挑战,提出了一种通过转移学习来改进死因分类任务的方法,实验结果表明,将病程记录的文本信息作为特征来结合分类任务,可以有效提高死因诊断准确性。
Oct, 2022
本文提出了一种具有注意力机制的分层深度学习模型,该模型可以根据诊断描述自动分配 ICD 诊断代码。实验结果表明,我们的深度学习模型能够在合理的范围内自动编码,并为计算机辅助 ICD 编码提供了框架。
Nov, 2017
本文提出了一种新颖的 ICD 索引方法,采用多级深度扩张残余卷积编码器来聚合临床记录的信息,学习不同长度文本的文档表示;通过辅助医疗记录的医学知识,包括临床文本、临床编码术语和药物处方等,以更好地推断 ICD 代码;引入图卷积网络利用 ICD 代码的共现模式,提高标签表示质量。实验结果表明,所提出的方法在多项指标上达到了最先进的性能。
May, 2024
本研究探讨了使用预训练的生成型大语言模型 (GPT-3.5、GPT-4 和 Llama 2) 自动分配历史死因的 ICD-10 编码的可行性。研究结果显示,虽然 GPT-3.5、GPT-4 和 Llama 2 对于今天仍在使用的术语和短短的死因描述表现更好,但它们在历史 ICD-10 编码任务中的准确性仍然不足,建议进一步微调或采用其他框架以达到足够的性能。
本文提出了一种基于深度学习集成模型的方法,可以自动标注阅片报告,并提高了国际癌症疾病分类(ICD-O)的拓扑分类的准确性,特别是针对乳腺癌的分类。
Aug, 2020
电子病历是研究阿片类药物使用障碍的数据来源,研究表明存在被低估的阿片类药物使用障碍诊断,然而问题性阿片类药物使用可以在临床记录中被记录。通过自然语言处理 (NLP) 工具和 ICD 阿片类药物使用障碍诊断编码,本研究在两个退伍军人事务办公区的病例组 (n=222,371) 的临床记录中鉴定了存在问题性阿片类药物使用的患者,并比较了通过 NLP 和 ICD 编码鉴定患者的人口特征和临床特征,发现通过 NLP 鉴定的患者普遍更可能为女性。
Jan, 2024
研究通过采用深度学习等机器学习方法,对临床笔记进行自动代码映射,结果表明这些深度学习方法优于其他传统机器学习模型,并且在 MIMIC-III 数据集上能够准确估计和预测 ICD-9 医疗代码。
Feb, 2018
该论文提出了一种可扩展的工作流程,在利用包括 NLP、AutoML 和 Clinician-in-the-Loop 机制在内的技术,从 EHR 的结构化和非结构化的文本记录中构建机器学习分类器来评估患者。在 MIMIC-III 数据集上进行的案例研究表明,该提议的工作流程在识别患有卵巢癌、肺癌、癌症恶病质和狼疮性肾炎等疾病的病人方面表现出更高的分类性能,并且可以发现更多的由编码问题所引起的未编码患者。
May, 2022
本文提出了一个两阶段解码机制来预测国际疾病分类(ICD)码,该模型利用了代码的分层属性,在公共 MIMIC-III 数据集上表现良好。
May, 2023
通过分析 NVDRS 的注释不一致性,我们采用了一种经验性的自然语言处理方法来检测问题实例,并采用了交叉验证的模式来识别出有问题的情况,结果显示将目标州的数据纳入训练自杀危机分类器可以使 F-1 得分提高 5.4%,对其他州的测试集得分则降低了 1.1%。最后,我们提出了一种 NLP 改进方案。
Mar, 2024