Sep, 2024

阐明文本到图像扩散模型中的最佳奖励-多样性权衡

TL;DR本研究针对文本到图像扩散模型在训练过程中产生的不安全和不符合人类偏好的图像问题,提出了一个新的解决方案。通过引入受启发的Annealed Importance Guidance (AIG) 正则化技术,我们在优化奖励的同时保留了生成图像的多样性,实验结果显示AIG可以有效提高图像的多样性和质量,从而实现奖励与多样性的最佳权衡。