Dec, 2022

ROSCOE: 评分逐步推理的一套度量指标

TL;DR本研究提出了 ROSCOE,这是一种可解释且无监督的自动评分方法,可以测量大型语言模型的语义连贯性,逻辑性,信息量,流畅度和事实性,分别针对人类注释和程序干扰的诊断数据集进行了实证验证并证明其效果优于基线方法。