Apr, 2024

MRScore: 基于 LLM 的放射学报告生成评估系统

TL;DR该研究介绍了 MRScore,一种针对放射学报告生成的自动评估指标,通过利用大型语言模型 (LLMs)。相较于传统的自然语言生成 (NLG) 指标如 BLEU,MRScore 更准确地评估生成的放射学报告。作者与放射科医生合作开发了一个框架,该框架指导 LLMs 进行放射学报告评估,以确保与人类分析保持一致。我们的实验证明 MRScore 与人类判断有更高的相关性,并在模型选择方面表现出优越性能。我们的代码和数据集将在 GitHub 上提供。