利用语言进行图像的语义增强
通过使用图像转图像的方法、以及预训练的文本到图像扩散模型将其参数化,解决了数据扩增过程中具有高级语义标注的动物种类等属性缺乏多样性的问题,并在少样本情境和杂草识别任务中得到实际应用。
Feb, 2023
本文系统评估了扩散模型生成图像的现有方法,并研究了新的扩展方式以评估它们对数据增强的益处。作者发现,将扩散模型个性化到目标数据的方法优于简单的提示策略,但使用扩散模型的训练数据,通过简单的最近邻检索程序,直接提高下游性能。此项研究揭示了扩散模型在数据增强方面的局限性,同时也突显了其在生成新训练数据方面的潜力,以提高在简单的下游视觉任务中的性能。
Apr, 2023
通过生成式视觉 - 语言模型来增强艺术品数据集,以应对文化遗产领域中有限的注释数据和领域偏移,提高模型对艺术特征的理解和生成恰当术语的能力。
Aug, 2023
本研究提出了一种基于多模态数据增强技术的图像字幕生成方法,旨在解决图像字幕对齐困难的问题。实验证明,本方法可以通过高质量生成图像 - 字幕对来扩充训练数据集,从而提高模型的训练效率和预测准确性。
May, 2023
通过扩散步骤,DiffAug 引入了一种新颖且高效的基于扩散的数据增强技术,以确保增强数据和原始数据在光滑的潜在空间中共享,从而通过无需标签、外部数据 / 模型或先前知识的约束来提高图像分类和聚类准确性,可适用于视觉和生物领域。
Sep, 2023
本文系统地综述了不同的图像数据增强方法,提出了分类学,分析了这些方法的优点和局限性,以及在三个典型的计算机视觉任务上所做的大量实验,包括语义分割,图像分类和物体检测。最后,我们讨论了数据增强面临的挑战以及未来的研究方向,以提出一些有用的研究指导。
Apr, 2022
深度生成模型在医学图像增强中的应用和潜力是本综述的重点,旨在通过人工合成更真实多样且符合数据真实分布的数据样本来改善医学图像分析中深度学习算法的性能,涵盖了三种类型的深度生成模型:变分自编码器、生成对抗网络和扩散模型。
Jul, 2023
本研究使用大规模的文本到图像扩散模型对分类条件模型进行微调,进而在 ImageNet 分类准确性得分上实现了显著的提升,证明了利用自然图像模型进行生成数据增强的可行性。
Apr, 2023
本研究介绍了一种基于自然语言描述的图像增广方法(ALIA),通过大规模视觉模型与语言模型的结合,自动生成域名描述,实现对样本数据的增广。该算法有效提高了训练数据的多样性,经过测试在细粒度和复杂分类中表现良好。
May, 2023
大型模型驱动的数据增强方法的综述,包括图像增强、文本增强和配对数据增强三个主要类别以及相关的数据后处理技术和应用领域,评估了大型模型驱动的数据增强在不同场景下的成功和限制,并提出了未来研究的挑战和方向。
Jan, 2024