学习数据增强：文本识别联合数据增强和网络优化

CVPRMar, 2020

学习数据增强：文本识别联合数据增强和网络优化

Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition

Canjie Luo, Yuanzhi Zhu, Lianwen Jin, Yongpan Wang

TL;DR本文提出了一种新的文本图像增强方法，使用自定义的参考点来生成更适合训练识别网络的样本，并通过联合学习框架优化训练过程，实验证明该方法显著提高了识别网络的性能。

Abstract

Handwritten text and scene text suffer from various shapes and distorted patterns. Thus training a robust recognition model requires a large amount of data to cover diversity as much as possible. In contrast to data collection and annotation, data augmentation is a low cost way. In this paper, we propose a new method for →

text image augmentation fiducial points recognizer joint learning performance

发现论文，激发创造

手写图像增强

介绍了一种名为手写数据增强的新型数据增强方法，主要应用于手写字符图像上，通过改变训练输入字符的形状来增加手写图像数据，实现了与基于卷积神经网络的光学字符识别模型的集成，并可与常用的数据增强技术（例如裁剪、旋转）一起使用，提高光学字符识别方法开发的手写图像数据集的性能。

Aug, 2023

联合优化数据增强和网络训练：对抗数据增强在人体姿势估计中的应用

提出对抗数据增强方法来优化神经网络模型的训练，通过生成难度较高的增强操作来让网络进行学习，实现训练的同时进行数据增强，对人体姿势估计问题进行实验测试，证明该方法能够显著提高模型性能而不需要额外的数据增强。

May, 2018

学习为数据增强编写领域特定变换

利用生成对抗算法学习序列模型来自动生成数据增强方法，有效提高图片和文本数据集的识别准确度。

Sep, 2017

HandAugment：基于深度的三维手部姿态估计的简单数据增强方法

本文提出了 HandAugment，一种方法来合成图像数据以增强神经网络的训练过程，在 HANDS 2019 挑战赛中，该方法取得了深度为基础的 3D 手部姿势估计任务的第一名。

Jan, 2020

学习数据有效的具有表征不变性的动作识别

使用不同的数据增强策略对视频进行数据增强，结合现有的半监督学习框架，能够在低标签模式下提高 Kinetics-100/400, Mini-Something-v2, UCF-101 和 HMDB-51 数据集的性能，并在完全监督的情况下证明提高了性能。

Mar, 2021

TextAug：用于多模态个体再识别的测试时间文本增强

研究探讨了一种名为 CutMixOut 的新方法，该方法将 Cutout 和 CutMix 两种数据增强技术相结合，通过随机删除文本中的单词或子短语并混合多个句子的部分内容，实现对多模态人员重新识别任务性能的简单有效提升。

Dec, 2023

文本分类数据增强调查

本文旨在提高机器学习分类系统的泛化能力，通过对数据进行转换的方式来人工创建训练数据，从而增强数据的多样性，该文章就在「文本分类」中，对数据增强方法及其应用目标做了详细概述与分类，最终针对相关领域，提出建设性思路方向。

Jul, 2021

无增强数据的文本生成数据增强

该文提出一种没有使用特定映射函数构造数据增强数据的方法来解决文本生成任务中的数据增强问题，该方法可以有效地优化并应用于文本生成任务的流行损失函数，收敛速率得到保证，实验结果证明该方法可以达到甚至超过流行的数据增强方法。

May, 2021

GenAug：用于微调文本生成器的数据增强

本研究探索了一种名为 GenAug 的文本生成数据增强方法，利用包括外部知识在内的各种增强方法在 Yelp 评论的子集上进行 GPT-2 微调，并研究了增强数量与生成文本质量之间的关系，实验表明插入字符级合成噪声和使用上位词进行关键词替换是有效的增强方法，生成质量在原始数据量的三倍左右达到峰值。

Oct, 2020

在分割中联合优化类别特定的训练和测试时数据增强

本文提出了一种针对医学图像分割的高效通用数据增强框架，采用了计算效率高且数据效率高的基于梯度的元学习方案，通过使用用于未见测试数据的代理验证数据明确对齐训练和验证数据的分布以改进增广策略。本文通过两个核心设计改进了当前数据增广策略，即在训练时有效学习类别特定的数据增强并联合优化训练时和测试时数据增强，实验证明该方法针对医学图像分割存在的分类不平衡问题，可显著且一致地提高分割效果。

May, 2023