Nupur Kumari, Richard Zhang, Eli Shechtman, Jun-Yan Zhu
TL;DR利用预训练计算机视觉模型的嵌入向量的线性可分性来选择最准确的子集,并以渐进式添加到鉴别器合集中,可以显著提升 GAN 训练的性能,在有限数据和大规模设置下都表现良好。
Abstract
The advent of large-scale training has produced a cornucopia of powerful
visual recognition models. However, generative models, such as gans, have
traditionally been trained from scratch in an unsupervised manner
使用预训练生成器,通过对潜在代码进行扰动以创建自然图像的变化,然后使用 StyleGAN2 进行分类任务,并发现该过程存在多个设计决策,包括扰动程序、增强图像和原始图像之间的加权以及对合成图像进行训练的分类器等,最终发现,虽然使用基于 GAN 的增强可以带来小幅改进,但 GAN 重构的效率和精度,以及分类器对 GAN 生成图像的敏感性仍然是瓶颈。