Nov, 2023

医学摘要中省略的外在评估

TL;DR我们提出了一种针对医学摘要的新的遗漏评估基准 MED-OMIT,通过模拟每个事实对下游临床任务(鉴别诊断生成)的影响,将医生 - 患者对话和生成的摘要分类为一组事实并识别其在摘要中的遗漏。我们使用基于 LLM 提示的方法对事实的重要性进行排序并将其聚类为支持或否认诊断的证据。通过在公开数据集上评估 MED-OMIT,我们发现 MED-OMIT 比其他度量方法更好地捕捉到了遗漏。