Jun, 2024

扩散模型中的水晶球假设:从初始噪声预测物体位置

TL;DR通过分析生成图像中物体边界框的离散程度,研究发现初始噪声图像中的特定区域(称为触发补丁)在生成的图像中起到了关键作用;通过在不同的噪声之间提取和注入这些补丁,可以在目标区域生成物体。研究还提出了一种拒绝采样策略来获得最佳噪声,旨在改善提示遵从性和图像生成的位置多样性。