CVPRDec, 2023

解锁预训练的图像骨干网络用于语义图像合成

TL;DR提出了一种新型的基于特征骨干网络和交叉注意力机制的生成对抗网络(GAN)辨别器,用于语义图像合成,实现了在 ADE-20K,COCO-Stuff 和 Cityscapes 数据集上与输入标签地图的图像质量和一致性方面的最先进结果,相较于最近的扩散模型,在推理过程中计算量减少了两个数量级。