Apr, 2024

使用 Gecko 重新审视文本到图像评估:关于指标、提示和人类评级

TL;DR我们通过对自动评价度量和人类模板进行广泛研究,介绍了一种综合的基于技能的基准,收集了超过 100,000 个注释,并引入了一种新的基于问答的自动评价度量,以在各种人类模板和 TIFA160 上更好地与人类评分相关联。