基于扩散模型的数据扩充技术
通过使用图像转图像的方法、以及预训练的文本到图像扩散模型将其参数化,解决了数据扩增过程中具有高级语义标注的动物种类等属性缺乏多样性的问题,并在少样本情境和杂草识别任务中得到实际应用。
Feb, 2023
利用生成式文本到图像模型的最新进展,我们引入了数据集精炼使用扩散模型 (D3M) 作为一种新的数据集精炼范式。通过文本反演技术,我们利用学习到的文本提示为大型数据集创建简洁且有信息量的表示,以在固定的内存预算内有效地存储和推理新样本,并通过在不同内存预算下在各种计算机视觉基准数据集上进行的广泛实验验证了我们方法的有效性。
Mar, 2024
使用 Diffusion Probabilistic Models 扩展医学图像分割数据集的方法,通过从高斯噪声采样各种掩膜来确保多样性,然后综合图像来确保图像和掩膜的对齐,并选择高质量样本以进一步增强 DiffuseExpand 的数据扩展效果。
Apr, 2023
我们提出了一种结合潜在空间扩散模型和数据集精炼的潜在数据集精炼方法(LD3M),旨在解决机器学习面临的大型数据集和高分辨率图像生成的挑战,并在多个 ImageNet 子集和高分辨率图像上实验表明,LD3M 在 1 个和 10 个图像每类的情况下,相比最先进的精炼技术,提高了最高 4.8 个百分点和 4.2 个百分点的性能。
Mar, 2024
该论文提出了一个新的基于扩散模型的分类导向框架 DreamDA,通过考虑训练图像中的原始数据作为种子并扰动其反扩散过程,DreamDA 生成符合原始数据分布的多样样本,并引入自训练范式生成伪标签和使用合成数据训练分类器,在四个任务和五个数据集上进行的广泛实验证明了 DreamDA 在合成高质量多样的图像并生成准确标签方面的有效性。
Mar, 2024
通过扩散步骤,DiffAug 引入了一种新颖且高效的基于扩散的数据增强技术,以确保增强数据和原始数据在光滑的潜在空间中共享,从而通过无需标签、外部数据 / 模型或先前知识的约束来提高图像分类和聚类准确性,可适用于视觉和生物领域。
Sep, 2023
通过使用基于 DALL-E 和扩散模型的生成模型,我们提出了 DatasetDM,一个通用的数据集生成模型,可以生成各种合成图像和相应的高质量感知注释。训练仅需要少于 1%的手动标记图像,使得生成无限大的注释数据集成为可能。我们生成了具有丰富密集像素级标签的数据集,并在语义分割和实例分割方面取得了最先进的结果。
Aug, 2023
本文系统评估了扩散模型生成图像的现有方法,并研究了新的扩展方式以评估它们对数据增强的益处。作者发现,将扩散模型个性化到目标数据的方法优于简单的提示策略,但使用扩散模型的训练数据,通过简单的最近邻检索程序,直接提高下游性能。此项研究揭示了扩散模型在数据增强方面的局限性,同时也突显了其在生成新训练数据方面的潜力,以提高在简单的下游视觉任务中的性能。
Apr, 2023
当前的感知模型依赖于资源密集型的数据集,因此需要创新性的解决方案。通过利用扩散模型和合成数据,通过从各种注释中构建图像输入,有助于下游任务。DetDiffusion 首次统一了生成模型和感知模型,解决了为感知模型生成有效数据的挑战。为了增强感知模型的图像生成能力,我们引入了感知感知损失(P.A. 损失),通过分割改善图像的质量和可控性。为了提高特定感知模型的性能,我们的方法在生成过程中提取和利用感知感知属性(P.A. 属性)进行自定义数据增强。目标检测任务的实验结果突出了 DetDiffusion 卓越的性能,在布局引导生成方面建立了新的最先进技术水平。此外,DetDiffusion 生成的图像合成能够有效增强训练数据,显著提高下游检测性能。
Mar, 2024