人类中心视觉数据增强

Mar, 2024

Data Augmentation in Human-Centric Vision

Wentao Jiang, Yige Zhang, Shaozhong Zheng, Si Liu, Shuicheng Yan

TL;DR本调查在人相关的视觉任务中首次提供了对数据增强技术的全面分析。它深入研究了人物 ReID、人体解析、人体姿态估计和行人检测等广泛的研究领域，解决了过拟合和有限训练数据在这些领域中带来的重要挑战。我们将数据增强方法分为两类：数据生成和数据扰动。数据生成包括基于图形引擎的生成、基于生成模型的生成和数据重组等技术，而数据扰动分为图像级和人体级扰动。每种方法都针对人相关任务的独特需求进行了定制，其中一些方法适用于多个领域。我们的贡献包括广泛的文献回顾，深入洞察这些增强技术在人相关视觉中的影响，并突出每种方法的细微差别。我们还讨论了开放问题和未来方向，例如融合像潜扩散模型之类的先进生成模型，以创造更真实多样的训练数据。这项调查不仅概括了人相关视觉数据增强的当前状态，还为未来研究制定了计划，旨在开发更强大、准确和高效的人相关视觉系统。

Abstract

This survey presents a comprehensive analysis of data augmentation techniques in human-centric vision tasks, a first of its kind in the field. It delves into a wide range of research areas including →

data augmentation human-centric vision person reid human parsing pedestrian detection

发现论文，激发创造

数据增强综述

数据增强是一系列通过操作现有数据样本生成高质量人工数据的技术，利用数据增强技术可以显著提高人工智能模型在涉及稀缺或不平衡数据集的任务中的适用性，从而大大提高模型的泛化能力。本文提出了一个更具启发性的分类法，该分类法涵盖了不同常见数据形式的数据增强技术，并通过一种统一的归纳方法对这些方法进行了分类。

May, 2024

人脸数据增强概述

本文从转换类型和方法的角度系统地回顾了现有的人脸数据增强研究，特别关注于基于深度学习的方法，尤其是生成式对抗网络。研究结果表明，这些方法为丰富人脸训练集并提高其质量提供了更有效的工具，并提出了评价它们的指标及未来的挑战。

Apr, 2019

大模型时代的数据增强调查

大型模型驱动的数据增强方法的综述，包括图像增强、文本增强和配对数据增强三个主要类别以及相关的数据后处理技术和应用领域，评估了大型模型驱动的数据增强在不同场景下的成功和限制，并提出了未来研究的挑战和方向。

Jan, 2024

图像数据增强方法综述及未来方向

本文介绍了深度学习算法在计算机视觉任务中的性能表现，以及数据增强技术对应对过拟合问题的应用。在这篇文章中，我们提供了数据增强技术的背景知识和综述，通过对现有的数据增强技术进行分类和比较，从而指导研究者选择适合自己的方法。我们还研究了数据增强技术的综合效果，得出结论可以显著提升图像分类、目标检测和语义分割的性能，我们提供了代码用于结果复现，并探讨了该领域未来的研究方向与挑战。

Jan, 2023

计算机视觉中合成数据增强方法的调查

这篇论文对合成数据增强技术进行了广泛评估，包括基于真实 3D 图形建模、神经风格迁移、差分神经渲染、生成对抗网络和变分自编码器等生成人工智能技术。对于每一种方法类别，我们关注重要的数据生成和增强技术、广泛的应用范围和具体的用例，以及现有限制和可能的解决方法。此外，我们总结了用于训练计算机视觉模型的常见合成数据集，强调主要特点、应用领域和支持的任务。最后，我们讨论了合成数据增强方法的有效性，并希望通过这篇详细的论文为读者提供必要的背景信息和深入了解现有方法及相关问题。

Mar, 2024

从鲁棒性视角理解数据增强

在视觉识别领域，数据增强作为一种关键技术可以增加模型的鲁棒性。本文从理论和实证的角度探讨数据增强的机制，揭示了其在模型鲁棒性中的作用，并通过实验证明了这些技术主要通过中高级游戏交互来刺激。此外，我们的研究还涵盖了多个数据集和各种增强技术，强调了我们的发现在各种情况下的普适性。通过揭示一个简化的代理方法，我们不仅能简化鲁棒性评估，还能深入了解模型游戏交互的固有动态及其与整体系统鲁棒性的关系。这些洞察力为重新评估视觉识别任务中的模型安全性和鲁棒性提供了新的透视。

Sep, 2023

基于扩散的图像标注及检索在文化遗产中的应用

通过生成式视觉 - 语言模型来增强艺术品数据集，以应对文化遗产领域中有限的注释数据和领域偏移，提高模型对艺术特征的理解和生成恰当术语的能力。

Aug, 2023

StyleGAN-Human: 人类生成的数据中心之旅

本研究从数据工程的角度出发，收集并注释了一个大规模人类图像数据集，并通过实验研究了数据量、数据分布和数据对齐等因素对 StyleGAN 生成高保真无条件人类图像的影响。结果显示，需要超过 40K 的大规模数据来训练高保真的 StyleGAN 生成模型；平衡的训练集有助于提高对罕见姿势的生成质量，而简单平衡服装纹理分布并不能有效改善生成效果；以身体中心为对齐锚点的人类 GAN 模型胜过使用面部中心或骨盆点对齐的模型。

Apr, 2022

深度学习中的图像数据增强：综述

本文系统地综述了不同的图像数据增强方法，提出了分类学，分析了这些方法的优点和局限性，以及在三个典型的计算机视觉任务上所做的大量实验，包括语义分割，图像分类和物体检测。最后，我们讨论了数据增强面临的挑战以及未来的研究方向，以提出一些有用的研究指导。

Apr, 2022

探究人类解析器对常见错误的鲁棒性

通过构建三个数据集来评估人体解析模型的风险容忍度，并提出一种新颖的异构数据增强机制，可以在常见的图像损坏条件下提高人体解析模型的鲁棒性。

Sep, 2023