Dec, 2023

基于迭代提示重标记的扩散模型与 RLDF

TL;DR我们提出了迭代提示重新标记 (IP-RLDF) 算法,通过迭代图像采样和提示重新标记将图像与文本对齐。IP-RLDF 在三种不同模型上进行了彻底实验,包括 SDv2、GLIGEN 和 SDXL,测试了它们根据指令生成图像的能力,并在具有挑战性的空间关系 VISOR 基准测试中实现了高达 15.22% 的改进,相比之前的 RL 方法表现出更强的性能。