通过利用生成的图像来增强现有数据集的技术,该论文探讨了各种有效的数据增强策略,以提高深度学习模型的跨域泛化能力。
Apr, 2024
本文系统评估了扩散模型生成图像的现有方法,并研究了新的扩展方式以评估它们对数据增强的益处。作者发现,将扩散模型个性化到目标数据的方法优于简单的提示策略,但使用扩散模型的训练数据,通过简单的最近邻检索程序,直接提高下游性能。此项研究揭示了扩散模型在数据增强方面的局限性,同时也突显了其在生成新训练数据方面的潜力,以提高在简单的下游视觉任务中的性能。
Apr, 2023
通过扩散步骤,DiffAug 引入了一种新颖且高效的基于扩散的数据增强技术,以确保增强数据和原始数据在光滑的潜在空间中共享,从而通过无需标签、外部数据 / 模型或先前知识的约束来提高图像分类和聚类准确性,可适用于视觉和生物领域。
Sep, 2023
数据增强在训练深度模型中至关重要,防止其对有限数据过拟合。常见的数据增强方法虽然有效,但最近生成式人工智能的进展,如用于图像生成的扩散模型,使得更复杂的增强技术成为可能,能够生成类似于自然图像的数据。我们引入了 GeNIe,它利用一个以文本提示为条件的扩散模型,将对比的数据点(源类别的图像和目标类别的文本提示)合并起来生成对目标类别具有挑战性的样本。受到最近图像编辑方法的启发,我们限制扩散迭代次数和噪声量。这确保生成的图像保留源图像的低级和上下文特征,可能与目标类别产生冲突。我们的大量实验证明了我们的新型增强方法的有效性,尤其对于只有有限样本的类别有益。
Dec, 2023
通过集成扩散模型,我们提出了一种新的四阶段方法来改善数据扩增的多样性,通过使用元提示生成指令,运用通用视觉 - 语言模型生成丰富的标题,微调地球观测扩散模型,并迭代地进行数据扩增,从而提高地球观测影像的语义丰富性和多样性。
Jun, 2024
该论文提出了一个新的基于扩散模型的分类导向框架 DreamDA,通过考虑训练图像中的原始数据作为种子并扰动其反扩散过程,DreamDA 生成符合原始数据分布的多样样本,并引入自训练范式生成伪标签和使用合成数据训练分类器,在四个任务和五个数据集上进行的广泛实验证明了 DreamDA 在合成高质量多样的图像并生成准确标签方面的有效性。
Mar, 2024
通过 Diff-Mix 方法进行图像翻译以实现数据增强,实现更好的忠实度和多样性平衡,从而在各种图像分类场景中显著提高性能。
最近,引入了一些基于图像混合的数据增强技术来改善深度神经网络的泛化能力。我们提出了一种名为 DiffuseMix 的新型数据增强技术,该技术利用扩散模型重塑训练图像,并使用我们量身定制的条件提示进行监督。DiffuseMix 在包括一般分类、细粒度分类、微调、数据稀缺性和对抗鲁棒性等任务上相较于现有最先进的方法取得了优越性能。
本研究提出了一种基于多模态数据增强技术的图像字幕生成方法,旨在解决图像字幕对齐困难的问题。实验证明,本方法可以通过高质量生成图像 - 字幕对来扩充训练数据集,从而提高模型的训练效率和预测准确性。
May, 2023
DistDiff 是一种基于分布感知扩散模型的有效数据扩充框架,通过构建分层原型来逼近真实数据分布,优化扩散模型中的潜在数据点,实现生成与目标分布一致的样本,从而在数据扩充任务中取得显著的改进。