May, 2024

利用提示学习从较低资源语言的 Crohn 病放射学报告中提取结构化信息

TL;DR自然语言处理在将自由文本放射学报告自动转换为结构化数据方面是至关重要的,但对于较少使用的语言而言,大型语言模型(LLM)在效果和潜在患者隐私风险上往往表现不佳。为了克服这些挑战,我们引入了 SMP-BERT,一种新的提示学习方法,利用报告的结构化特性。在涉及包括 8,000 名患者和 10,000 个以希伯来语编写的 Crohn's 病放射学报告的研究中,SMP-BERT 在性能方面大大超过了传统的微调方法,尤其能够检测到罕见疾病(AUC:0.99 vs 0.94,F1:0.84 vs 0.34)。SMP-BERT 提供了更准确的低资源语言的 AI 诊断能力。