利用大型语言模型对历史死因数据进行编码

May, 2024

利用大型语言模型对历史死因数据进行编码

Coding historical causes of death data with Large Language Models

Bjørn Pedersen, Maisha Islam, Doris Tove Kristoffersen, Lars Ailo Bongo, Eilidh Garrett...

TL;DR本研究探讨了使用预训练的生成型大语言模型(GPT-3.5、GPT-4和Llama 2)自动分配历史死因的ICD-10编码的可行性。研究结果显示，虽然GPT-3.5、GPT-4和Llama 2对于今天仍在使用的术语和短短的死因描述表现更好，但它们在历史ICD-10编码任务中的准确性仍然不足，建议进一步微调或采用其他框架以达到足够的性能。

Abstract

This paper investigates the feasibility of using pre-trained generative large language models (LLMs) to automate the assignment of icd-10 codes to →

发现论文，激发创造

使用机器学习将口述验尸叙述和二进制特征融合在高血糖死亡分析中

本研究旨在评估机器学习方法在分析结构化和非结构化叙述文本组成的言语验尸报告时的表现，结果表明文本特征对于确定死亡原因具有重要的信息价值，并且结合二进制和文本特征可以提高自动化 COD 分类任务的准确度。

Apr, 2022

从口述验尸报告中提高死因分类的准确性

该研究针对医疗领域中的自然语言处理技术应用挑战，提出了一种通过转移学习来改进死因分类任务的方法，实验结果表明，将病程记录的文本信息作为特征来结合分类任务，可以有效提高死因诊断准确性。

Oct, 2022

利用现成大型语言模型进行自动临床编码

利用大型预训练生成语言模型开发出零样本和少样本编码分配的实用解决方案，通过信息提取，利用ICD本体论和专业临床编码任务描述，检索相关提及，并利用GPT-4在第二阶段进行元细化，实现了自动ICD编码的方法，无需任务特定的学习，而在更稀缺的类别上达到了最优的性能。

Oct, 2023

用两阶段方法超越GPT-4医学编码

用大型语言模型进行临床决策支持和医疗编码任务，提出LLM-codex方法，通过两个阶段生成证据提案和基于LSTM的验证阶段，同时实现医疗编码精度、稀有编码准确性和句级证据识别的最新结果，无需依赖人工标注的数据证据。

Nov, 2023

使用结构化纵向电子健康记录数据激励大规模语言模型进行零样本临床预测

针对结构化长期电子健康记录 (EHR) 数据与大型语言模型 (LLMs) 集成时的固有复杂性，本研究调查了像 GPT-4 这样的LLMs 对 EHR 数据的适应性。特别关注其零样本能力，使其能够在并未明确训练的情况下进行预测。通过考虑特定的EHR特征(如单位和参考范围)，采用与临床环境相一致的上下文学习策略，我们的寻求方法能够应对 EHR 数据的纵向、稀疏和知识注入的特性。通过对 MIMIC-IV 和 TJH 数据集进行综合实验，证明了我们精心设计的提示框架下，LLMs在关键任务(如死亡率、住院天数和30天再入院率)的预测性能可以提高约35％，在少样本情景中超越了机器学习模型。我们的研究强调了LLMs在提高临床决策能力方面的潜力，尤其是在没有标签数据的紧急医疗情况下，如新发疾病的爆发。可通过此 https URL 获得代码，以便能重现研究结果。

Jan, 2024

从文本中提取临床标记的廉价方法

该论文描述了UniBuc考古团队在CLPsych的2024共享任务中的工作，其中包括在文本中找到支持所分配的自杀风险级别的证据。该工作关注评估大型语言模型（LLM），并与一种更加内存和资源高效的替代方法进行对比。

Mar, 2024

从叙述到数字：利用语言模型推断言述性验尸报告中的预测

该研究使用最先进的自然语言处理技术，开发了一种有效的方法，通过预测的自由文本结果从而进行推论，以处理公共卫生决策中的推断纠正问题。

Apr, 2024

评估大型语言模型用于公共卫生分类和提取任务

基于对LLMs在公共卫生任务中的自动评估，将六个外部注释数据集与七个新的内部注释数据集相结合，评估LLMs在处理与健康负担、流行病学危险因素和公共卫生干预相关的文本中的性能，发现Llama-3-70B-Instruct是性能最好的模型，在15个任务中取得最佳结果。这些初步结果表明，LLMs可能成为公共卫生专家从各种免费文本来源中提取信息，并支持公共卫生监测、研究和干预的有用工具。

May, 2024

大型语言模型是优秀的医学编码器，只要提供合适的工具

该研究介绍了一种用于自动ICD-10-CM医学编码的新型两阶段检索-排序系统，并将其性能与Vanilla Large Language Model (LLM)方法进行了比较。在对100个单项医疗状况的数据集上评估两个系统时，检索-排序系统在预测正确ICD-10-CM代码方面达到了100%的准确率，显著优于只有6%准确率的Vanilla LLM (GPT-3.5-turbo)。研究分析表明，检索-排序系统在处理不同专业的各种医学术语方面具有更高的精确性。尽管这些结果令人鼓舞，我们认识到使用简化输入的局限性以及进一步在更复杂、现实的医疗案例上进行测试的需求。这项研究为提高医学编码的效率和准确性的持续努力做出了贡献，突显了基于检索的方法的重要性。

Jul, 2024

大型语言模型在疾病诊断中的应用：范围审查

本研究针对大型语言模型在疾病诊断中的应用进行了全面分析，填补了目前研究中对特定疾病和模型技术的探讨不足。论文提出了数据预处理、模型选择和评估策略的指导方针，并概述了当前研究的局限性与未来方向。研究结果为利用大型语言模型进行疾病诊断提供了蓝图，有助于未来研究的系统化和指导。

Aug, 2024