Mar, 2024

重新思考基于聚类条件的扩散模型

TL;DR通过使用集群分配,我们对图像级别调制的扩散模型进行了全面的实验研究,并阐明了图像集群的个别组件对三个数据集上图像合成的影响。结合图像集群和扩散模型的最新进展,我们表明,给定图像合成的最优集群粒度(可视化组),集群调制可以实现最先进的 FID(即在 CIFAR10 和 CIFAR100 上分别为 1.67 和 2.17),同时具有强大的训练样本效率。最后,我们提出了一种通过仅基于特征的聚类来导出上部集群界限的新方法,从而减少视觉组的搜索空间。与现有方法不同,我们发现聚类与集群条件图像生成之间没有显著的联系。代码和集群分配将会发布。