May, 2023
INSTRUCTSCORE:自动反馈的可解释文本生成评估方法
INSTRUCTSCORE: Towards Explainable Text Generation Evaluation with Automatic Feedback
Wenda Xu, Danqing Wang, Liangming Pan, Zhenqiao Song, Markus Freitag...
TL;DR该研究介绍了 INSTRUCTSCORE,一种可解释的用于评估文本生成的评估度量标准,通过利用显式人类指令和 GPT4 的隐式知识来创建评估度量标准。研究结果表明,INSTRUCTSCORE 可以在不需要人类数据之间达到类似于 COMET22 等最先进度量标准的性能水平。