Augmentor: 用于机器学习的图像增强库
本文提出了一种名为SamplePairing的数据增强技术,通过随机选择训练数据中的另一幅图像,来合成一张新的图像样本。实验表明,该技术在图像分类任务中能够显著提高分类精度,并且在训练样本数较少的任务中,表现更为突出。
Jan, 2018
Albumentations是一个用于图像增广的快速和灵活的库,通过多种不同的图像变换操作增强了计算机视觉的效能,同时也是其他增广库易于使用的包装器,并提供了公开可用的源代码。
Sep, 2018
利用数据增强作为正则化方式,我们从解析角度重新考虑了数据增强在深度神经网络中的泛化问题,并发现它显著降低了模型泛化误差,但同时也导致略微增加了经验风险。使用较少的数据对完整增强的数据进行训练能够帮助模型更好地收敛于更好的区域,从而进一步提高准确性。
Sep, 2019
本文提出了一种名为AugPro的数据增强方法,通过在表示插值增强方法的基础上构建数据的多样性,并将增强数据转换为标记来避免转移决策边界,提高了蒸馏的性能并在计算效率上具有优势。
Oct, 2022
提出一种称为Tied-Augment的通用框架,通过为损失添加一个简单的项来控制失真下表示的相似性,以提高数据增强在广泛应用中的效能,从而改善半监督学习,优化和数据增强方法的表现。
May, 2023
该研究论文综述了基于自动机器学习(AutoML)原理的自动数据增强技术,讨论了利用AutoML实现数据增强的各种方法,包括数据操作、数据集成和数据合成技术,并对搜索空间设计、超参数优化和模型评估等数据增强子任务进行了广泛的讨论。最后,通过与传统增强方法基于经典方法的最新技术进行全面比较和分析,结果显示目前AutoML方法在数据增强方面的性能超过传统方法的最新技术。
Mar, 2024
数据增强是解决有限数据集挑战的关键技术之一,本文介绍了新开发的AugmenTory库,该库相较于现有方法在时间和空间上具备较低的计算需求,并且包括后处理阈值特性。
May, 2024
数据增强是一系列通过操作现有数据样本生成高质量人工数据的技术,利用数据增强技术可以显著提高人工智能模型在涉及稀缺或不平衡数据集的任务中的适用性,从而大大提高模型的泛化能力。本文提出了一个更具启发性的分类法,该分类法涵盖了不同常见数据形式的数据增强技术,并通过一种统一的归纳方法对这些方法进行了分类。
May, 2024
图像数据增强在计算机视觉任务中是一种重要的方法,它可以增强训练数据集的多样性和质量,从而提高机器学习模型在下游任务中的性能和鲁棒性。本研究对基于扩散模型的图像增强方法进行了系统、全面、深入的综述,涵盖了广泛的策略、任务和应用。具体而言,首先对扩散模型的基本原理、模型架构和训练策略进行了全面分析。随后,引入了相关图像增强方法的分类方法,重点介绍了语义操作、个性化和适应性以及特定应用增强任务的技术。然后,分析了性能评估方法和相应的评估指标。最后,讨论了当前领域面临的挑战和未来的研究方向。
Jul, 2024