Feb, 2025

DiffExp:文本到图像扩散模型的奖励微调中的高效探索

TL;DR本研究解决了文本到图像扩散模型在奖励微调过程中在线样本生成导致慢收敛的问题。我们提出了一种名为DiffExp的探索策略,通过动态调整无分类器引导的规模和随机加权文本提示短语,显著提升了样本生成的效率和多样性,从而提高了整体模型性能。