May, 2023

利用精细语义奖励提升文本到图像扩散模型

TL;DR本文提出 FineRewards 方法,通过引入两种细粒度语义奖励 ——caption reward 和 SAM reward,从两个语义视角提升 text-to-image 中文本和图像的匹配,实现模态对齐。在使用多个奖励函数指导训练的时候,FineRewards 方法在 MS-COCO 基准测试上优于其他基准奖励函数,并且与当前图像奖励的统一进一步提高了模型性能。