Feb, 2023

通过生成扩散指导的视角分析多模式目标

TL;DR通过使用分类器引导的扩散模型生成反映分类器提供的语义信号的图像,我们研究了多模态学习目标的特征,并比较了对比、匹配和字幕损失。我们还引入了一个简单的基线,不仅支持我们的分析,而且以直观的方式改进了生成引导的质量。