Jul, 2024

MJ-Bench: 您的多模态奖励模型真的是进行文本生成图像的好判断器吗?

TL;DR多模态评委通过提供反馈来评估图像生成模型的四个关键方面:对齐性、安全性、图像质量和偏见,并发现了近源VLM在平均上提供更好的反馈。