Apr, 2024

MRScore: 基于LLM的放射学报告生成评估系统

TL;DR该研究介绍了MRScore,一种针对放射学报告生成的自动评估指标,通过利用大型语言模型(LLMs)。相较于传统的自然语言生成(NLG)指标如BLEU,MRScore更准确地评估生成的放射学报告。作者与放射科医生合作开发了一个框架,该框架指导LLMs进行放射学报告评估,以确保与人类分析保持一致。我们的实验证明MRScore与人类判断有更高的相关性,并在模型选择方面表现出优越性能。我们的代码和数据集将在GitHub上提供。