BriefGPT.xyz
Jun, 2023
自动度量文本生成偏好评级中的错误校正
Correction of Errors in Preference Ratings from Automated Metrics for Text Generation
HTML
PDF
Jan Deriu, Pius von Däniken, Don Tuggener, Mark Cieliebak
TL;DR
本文介绍了一种基于统计模型的文本生成评估方法,利用自动化度量的优点和人工评级的精度,通过最佳组合的方式来改进文本生成评估的准确度,而且只需要使用人工评注的50%即可获得与100%人工评级相同的评估结果。
Abstract
A major challenge in the field of
text generation
is
evaluation
: Human evaluations are cost-intensive, and
automated metrics
often display
→