多元化训练，不是微调：使用合成图像扩大视觉识别训练规模

Dec, 2023

多元化训练，不是微调：使用合成图像扩大视觉识别训练规模

Diversify, Don't Fine-Tune: Scaling Up Visual Recognition Training with Synthetic Images

Zhuoran Yu, Chenchen Zhu, Sean Culatana, Raghuraman Krishnamoorthi, Fanyi Xiao...

TL;DR通过在大型语言模型和 CLIP 的辅助下，使用生成模型生成合成训练图像来解决类名的歧义性、缺乏多样性的问题，并利用域适应技术和辅助批归一化来减轻领域偏移，以更好地提升模型识别性能。

Abstract

Recent advances in generative deep learning have enabled the creation of high-quality synthetic images in text-to-image generation. Prior work shows that fine-tuning a pretrained diffusion model on ImageNet and g

generative deep learning text-to-image generation synthetic training images class name ambiguity domain shifts

发现论文，激发创造

合成图像在迁移学习中是否有用？关于数据生成、容量和利用的研究调查

通过合成图像数据生成实现的迁移学习模型训练为主题的研究中，我们提出了一种新的两阶段框架，称为桥接传递，通过使用合成图像进行模型微调从而提高其迁移能力，随后使用真实数据进行快速适应。同时，我们提出了数据集风格反转策略来提高合成图像与真实图像之间的风格对齐。通过在 10 个不同数据集和 5 个不同模型上的评估，我们展示了一致的改进效果，在分类任务上的准确率提高高达 30%。有趣的是，我们注意到改进还未饱和，这表明随着合成数据量的增加，还可能进一步提高收益。

Mar, 2024

扩散模型生成的合成数据提升 ImageNet 分类准确性

本研究使用大规模的文本到图像扩散模型对分类条件模型进行微调，进而在 ImageNet 分类准确性得分上实现了显著的提升，证明了利用自然图像模型进行生成数据增强的可行性。

Apr, 2023

模型训练中的合成图像缩放定律…… 目前而言

通过研究最先进的文本到图像模型生成的合成图像在规模上的表现，本文发现合成图像在训练监督图像分类器时性能较差原因是某些概念无法被现成的文本到图像模型生成，但对于与真实图像结合训练 CLIP 模型或存在真实图像供给不足或评估数据集与训练数据差异较大的情况下，扩大合成数据规模可能特别有效。

Dec, 2023

假装自己做到了：从合成的 ImageNet 克隆模型中学习可迁移的表征

本研究通过研究使用 Stable Diffusion 生成的合成图像作为 ImageNet 分类训练模型的数据集对比实际图像，探讨在训练图像预测模型时实际图像是否已经被合成图像取代，并发现在某些标准模型分类基准下训练合成图像可以缩小与真实图像训练模型之间的差距，从而展示训练合成图像的模型优秀的概括泛化性能和传输表现。

Dec, 2022

在跨概念设置中提高合成生成图像的检测

本文探讨了在不同概念类之间泛化的挑战，并提出了一种基于质量评估模型的质量抽样方法，通过 StyleGAN2 和 Latent Diffusion 生成的图像进行实验，结果表明采用本文提出的方法可以提高合成图像检测器的检测性能。

Apr, 2023

合成训练图像的未实现承诺：使用检索的真实图像性能更好

通过对比采用生成模型生成的人工数据和来自真实数据的有针对性图像进行微调，在任务上针对性生成的合成数据被真实数据普遍匹配或超越，这表明合成图像中存在生成器伪像和不准确的任务相关视觉细节。总体而言，我们认为在使用合成数据进行训练时，检索是一个必须考虑的关键基线。

Jun, 2024

利用合成训练数据提高深度学习质量检测的泛化能力

通过生成合成图像来解决领域不稳定性问题，从而使训练的深度学习模型更加稳健。我们描述了我们的合成数据生成管道和我们的深度学习方法来回答这些问题。

Feb, 2022

提高深度生成数据的效果

即使合成图像在下游图像分类任务中导致性能下降，通过使用合成图像增强真实数据可以在数据稀缺情况下提升下游分类任务的表现，内容差距是这一现象的较大部分原因，我们提出了策略来更好地利用深度生成模型中的合成图像。

Nov, 2023

对比 Syn-to-Real 泛化

本文提出了一种基于对比的从合成到真实的泛化（Contrastive Synthetic-to-Real Generalization, CSG）框架，该框架利用预训练的 ImageNet 知识防止过度拟合合成域，同时提高特征嵌入的多样性以改善泛化性能，还使用注意力池化（A-pool）来进一步提高泛化性能。研究结果表明，此方法在各种合成训练任务中展示了最新的零 - shot 域泛化性能。

Apr, 2021

分析虚假训练数据对深度学习系统性能的影响

本文深入分析了使用不同比例的真实数据和合成数据来训练计算机视觉模型对模型鲁棒性和预测质量的影响，证明使用生成对抗网络生成高质量合成数据可以减轻深度学习模型面临的挑战。

Mar, 2023