May, 2023

利用精细语义奖励提升文本到图像扩散模型

TL;DR本文提出FineRewards方法,通过引入两种细粒度语义奖励——caption reward 和 SAM reward,从两个语义视角提升text-to-image中文本和图像的匹配,实现模态对齐。在使用多个奖励函数指导训练的时候,FineRewards方法在MS-COCO基准测试上优于其他基准奖励函数,并且与当前图像奖励的统一进一步提高了模型性能。