Mar, 2023

文本到图像扩散模型是零样本分类器

TL;DR通过使用扩散模型的去噪能力作为代理,将零样本分类器应用于Imagen,探究其知识方面并与CLIP进行比较,结果显示Imagen与CLIP在零样本图像分类方面表现相当,同时在形状/纹理偏差测试方面取得了最先进的结果,能够成功地执行属性绑定,而CLIP则不能。因此,我们认为应该探索将生成预训练作为一种有吸引力的视觉和视觉语言问题的替代方法。