Apr, 2023

ImageReward: 学习和评估人类对文本到图像生成的偏好

TL;DR本文介绍了 ImageReward,第一个通用的文本到图像人类偏好奖励模型,通过系统注释流程,其训练基于涵盖评级和排名组件的数据集,包括 137k 个专家比较。在人类评估中,ImageReward 超越了现有的评分方法(例如 CLIP),成为评估和改进文本到图像合成的有前途的自动度量标准。该奖励模型可通过 exttt {image-reward} 包在 https://github.com/THUDM/ImageReward 上公开获得。