本研究针对图像分类器的训练方法进行了探讨,通过元学习算法对支持数据、查询数据和任务进行复杂的抽样,利用数据增强方法不仅可增加每个类别的图片数量,还可生成全新的类别和任务,提高了元学习器在少样本分类基准上的性能。
Oct, 2020
提出了一种基于贝叶斯公式,利用广义蒙特卡洛期望最大化算法和生成对抗网络的方法,能更好地生成新的标注训练样本,并在 MNIST,CIFAR-10 和 CIFAR-100 的数据集中取得了优于现有数据增强方法和 GAN 模型的分类结果。
Oct, 2017
数据增强是一系列通过操作现有数据样本生成高质量人工数据的技术,利用数据增强技术可以显著提高人工智能模型在涉及稀缺或不平衡数据集的任务中的适用性,从而大大提高模型的泛化能力。本文提出了一个更具启发性的分类法,该分类法涵盖了不同常见数据形式的数据增强技术,并通过一种统一的归纳方法对这些方法进行了分类。
May, 2024
本文研究数据增强在图像分类中的应用,对比了多种增强技术,包括传统的裁剪、旋转和翻转以及使用 GAN 生成不同风格的图像,并提出了一种名为神经增强的方法,通过训练神经网络自学习增强,以提升分类器性能,对该方法在不同数据集上表现的优劣进行了讨论。
Dec, 2017
研究使用各种数据增强技术来系统地生成伪标记数据的过程,并分析了在生产中实现数据增强方法时的关键考虑因素。
Jun, 2022
本研究探索了数据增强技术对文字分类的影响,使用多种数据增强技术,包括过采样、易用数据增强、反向翻译、灰度缩放以及一种少样本学习的方法 PTE。结果表明,数据增强技术对模型性能只有轻微且不一致的改进,少数同义词替换可以提高模型性能,灰度缩放需要进一步研究,PTE 的表现优于监督学习,尤其是在类别容易分离的情况下。
Mar, 2023
本文介绍了一种自动搜索图像数据增强策略,使用神经网络在目标数据集上产生最高准确性,并在 CIFAR-10,CIFAR-100,SVHN 和 ImageNet 数据集上实现了最先进的准确性,同时找到的增强策略可在不同数据集间转移学习。
May, 2018
本文旨在提高机器学习分类系统的泛化能力,通过对数据进行转换的方式来人工创建训练数据,从而增强数据的多样性,该文章就在「文本分类」中,对数据增强方法及其应用目标做了详细概述与分类,最终针对相关领域,提出建设性思路方向。
Jul, 2021
通过探索一种更加广义的混合样本数据增强方法,可以发现一大类实用的数据增强技术,包括超越之前最先进技术的方法,从而提高性能,并表明当前的有效性理论是不完整的,建立这种理论必须解释更广泛的现象。
本文研究如何将数据增强应用于无监督特征学习,我们将各种变换应用于随机图像块,通过卷积神经网络分类学习到有用的特征表示,同时实验结果显示这一算法能在多个视觉数据集上取得较为有竞争性的分类结果。
Dec, 2013