May, 2023

INSTRUCTSCORE:自动反馈的可解释文本生成评估方法

TL;DR该研究介绍了 INSTRUCTSCORE,一种可解释的用于评估文本生成的评估度量标准,通过利用显式人类指令和 GPT4 的隐式知识来创建评估度量标准。研究结果表明,INSTRUCTSCORE 可以在不需要人类数据之间达到类似于 COMET22 等最先进度量标准的性能水平。