学习数据增强:文本识别联合数据增强和网络优化
介绍了一种名为手写数据增强的新型数据增强方法,主要应用于手写字符图像上,通过改变训练输入字符的形状来增加手写图像数据,实现了与基于卷积神经网络的光学字符识别模型的集成,并可与常用的数据增强技术(例如裁剪、旋转)一起使用,提高光学字符识别方法开发的手写图像数据集的性能。
Aug, 2023
提出对抗数据增强方法来优化神经网络模型的训练,通过生成难度较高的增强操作来让网络进行学习,实现训练的同时进行数据增强,对人体姿势估计问题进行实验测试,证明该方法能够显著提高模型性能而不需要额外的数据增强。
May, 2018
本文提出了 HandAugment,一种方法来合成图像数据以增强神经网络的训练过程,在 HANDS 2019 挑战赛中,该方法取得了深度为基础的 3D 手部姿势估计任务的第一名。
Jan, 2020
使用不同的数据增强策略对视频进行数据增强,结合现有的半监督学习框架,能够在低标签模式下提高 Kinetics-100/400, Mini-Something-v2, UCF-101 和 HMDB-51 数据集的性能,并在完全监督的情况下证明提高了性能。
Mar, 2021
研究探讨了一种名为 CutMixOut 的新方法,该方法将 Cutout 和 CutMix 两种数据增强技术相结合,通过随机删除文本中的单词或子短语并混合多个句子的部分内容,实现对多模态人员重新识别任务性能的简单有效提升。
Dec, 2023
本文旨在提高机器学习分类系统的泛化能力,通过对数据进行转换的方式来人工创建训练数据,从而增强数据的多样性,该文章就在「文本分类」中,对数据增强方法及其应用目标做了详细概述与分类,最终针对相关领域,提出建设性思路方向。
Jul, 2021
该文提出一种没有使用特定映射函数构造数据增强数据的方法来解决文本生成任务中的数据增强问题,该方法可以有效地优化并应用于文本生成任务的流行损失函数,收敛速率得到保证,实验结果证明该方法可以达到甚至超过流行的数据增强方法。
May, 2021
本研究探索了一种名为 GenAug 的文本生成数据增强方法,利用包括外部知识在内的各种增强方法在 Yelp 评论的子集上进行 GPT-2 微调,并研究了增强数量与生成文本质量之间的关系,实验表明插入字符级合成噪声和使用上位词进行关键词替换是有效的增强方法,生成质量在原始数据量的三倍左右达到峰值。
Oct, 2020
本文提出了一种针对医学图像分割的高效通用数据增强框架,采用了计算效率高且数据效率高的基于梯度的元学习方案,通过使用用于未见测试数据的代理验证数据明确对齐训练和验证数据的分布以改进增广策略。本文通过两个核心设计改进了当前数据增广策略,即在训练时有效学习类别特定的数据增强并联合优化训练时和测试时数据增强,实验证明该方法针对医学图像分割存在的分类不平衡问题,可显著且一致地提高分割效果。
May, 2023