May, 2024

利用大型语言模型对历史死因数据进行编码

TL;DR本研究探讨了使用预训练的生成型大语言模型(GPT-3.5、GPT-4和Llama 2)自动分配历史死因的ICD-10编码的可行性。研究结果显示,虽然GPT-3.5、GPT-4和Llama 2对于今天仍在使用的术语和短短的死因描述表现更好,但它们在历史ICD-10编码任务中的准确性仍然不足,建议进一步微调或采用其他框架以达到足够的性能。