语义生成增强在少样本计数中的应用

Oct, 2023

语义生成增强在少样本计数中的应用

Semantic Generative Augmentations for Few-Shot Counting

Perla Doubinsky, Nicolas Audebert, Michel Crucianu, Hervé Le Borgne

TL;DR通过使用合成数据和多样化生成策略，本研究探讨了合成数据对于少样本计数问题中的作用，并显示其显著改进了两种最近的高性能少样本计数模型在 FSC147 和 CARPK 数据集上的计数准确性。

Abstract

With the availability of powerful text-to-image diffusion models, recent works have explored the use of synthetic data to improve image classification performances. These works show that it can effectively augment or even replace real data. In this work, we investigate how

synthetic data few-shot counting text-to-image models diversified generation strategy counting accuracy

发现论文，激发创造

高保真文本图像合成计数指导

本研究提出了一种方法来改善文本到图像扩散模型，使其能够准确生成输入提示中所指定的物体数量，方法包括采用计数网络和引入注意力地图引导来获得物体的高保真度掩膜并通过计算梯度产生每个物体的去噪过程引导。

Jun, 2023

精确物体数量的文本到图像生成

通过分离并计算对象的实例以及修复缺失对象的形状和位置，本文提出了一种名为 CountGen 的模型，该模型在生成图像时能够准确控制对象的数量。

Jun, 2024

AFreeCA：无需标注的全能计数

利用文本到图像的潜在扩散模型 (LDMs)，本研究介绍了一种无监督的排序方法，通过借助生成的计数数据，对任意类型的对象进行可靠计数，该方法优于其他无监督和少样本方法，不受特定对象类别计数数据的限制。

Mar, 2024

SYRAC: 合成、排序和计数

使用潜在扩散模型生成合成数据，通过排名图像对进行预训练，并使用人群数量特征对噪声合成图像拟合线性层，从而实现无监督人群计数的最新结果。

Oct, 2023

图像标题是文本到图像模型的自然提示

论文理论分析了合成数据的训练效果和提示诱导的合成数据分布之间的关系，并相应地提出了一种简单而有效的方法，通过图像字幕和类名来提示生成模型，从而合成更具信息性和多样性的训练数据。实验证明，该方法显着提高了在合成训练数据上训练的模型的表现。

Jul, 2023

合成样例提高罕见类别泛化能力

研究了少量样本学习的一个解决方案，通过模拟数据来扩充现有训练数据，并应用于动物物种分类。研究结果显示，使用模拟数据可以大幅降低对稀有分类的误分类率，并且随着模拟数据量的增加，目标分类的准确性也随之提高，同时高变化的模拟数据提供了最大的性能提升。

Apr, 2019

扩散模型生成的合成数据提升 ImageNet 分类准确性

本研究使用大规模的文本到图像扩散模型对分类条件模型进行微调，进而在 ImageNet 分类准确性得分上实现了显著的提升，证明了利用自然图像模型进行生成数据增强的可行性。

Apr, 2023

多元化训练，不是微调：使用合成图像扩大视觉识别训练规模

通过在大型语言模型和 CLIP 的辅助下，使用生成模型生成合成训练图像来解决类名的歧义性、缺乏多样性的问题，并利用域适应技术和辅助批归一化来减轻领域偏移，以更好地提升模型识别性能。

Dec, 2023

Lafite2: 少样本文本到图像生成

本文提出了一种在仅有图像数据集的情况下预训练文本到图像生成模型的新方法，通过检索和优化过程综合生成伪文本特征，可以灵活应用于各种情境和模型，并在实验中表现出显著的效果，GAN 模型在完全监督的情况下得到了 6.78 的 FID，是 GAN 最新的 SoTA 结果。

Oct, 2022

基于扩散的数据增强用于目标计数问题

使用扩散模型生成的合成数据对深度学习方法在人群计数方面进行增强，减小了真实数据有限导致的过拟合问题，该方法在多个数据集上表现出了显著的性能提升。

Jan, 2024