Sep, 2024

利用语言模型和检索增强生成技术从诊断报告中自动提取结构化数据

TL;DR本研究旨在开发一个自动化系统,从非结构化的放射学和病理学报告中提取结构化临床信息,解决了当前信息提取的准确性和有效性问题。研究利用开源大语言模型和检索增强生成技术,发现新型和领域微调模型在提取准确性上表现优异,最佳模型在提取BT-RADS评分和IDH突变状态时均达到了高于90%的准确率。这一成果为医疗数据提取提供了可靠的方法,强调了人机协作的潜力。