Augmentor: 用于机器学习的图像增强库

Aug, 2017

Augmentor: 用于机器学习的图像增强库

Augmentor: An Image Augmentation Library for Machine Learning

Marcus D. Bloice, Christof Stocker, Andreas Holzinger

TL;DRAugmentor是一个Python和Julia版本的软件包，使用基于管道的随机方法对现有观察数据进行数据增强，并提供大量常用机器学习数据增强任务的助手函数和多种高级特性。

Abstract

The generation of artificial data based on existing observations, known as data augmentation, is a technique used in machine learning to improve model accuracy, generalisation, and to control overfitting.

发现论文，激发创造

配对样本增强图像分类数据

本文提出了一种名为SamplePairing的数据增强技术，通过随机选择训练数据中的另一幅图像，来合成一张新的图像样本。实验表明，该技术在图像分类任务中能够显著提高分类精度，并且在训练样本数较少的任务中，表现更为突出。

Jan, 2018

Albumentations：快速灵活的图像增强

Albumentations是一个用于图像增广的快速和灵活的库，通过多种不同的图像变换操作增强了计算机视觉的效能，同时也是其他增广库易于使用的包装器，并提供了公开可用的源代码。

Sep, 2018

数据增强再探讨：重新审视干净数据和扩充数据之间的分布差距

利用数据增强作为正则化方式，我们从解析角度重新考虑了数据增强在深度神经网络中的泛化问题，并发现它显著降低了模型泛化误差，但同时也导致略微增加了经验风险。使用较少的数据对完整增强的数据进行训练能够帮助模型更好地收敛于更好的区域，从而进一步提高准确性。

Sep, 2019

数据增强作为特征操作

本文研究数据增强对学习过程动态的影响，发现数据增强可以改变各种特征的相对重要性，特别是对于神经网络等非线性模型更为明显，可以被看作是特征操作。

Mar, 2022

投影增强：一种有效高效的蒸馏数据增强范式

本文提出了一种名为AugPro的数据增强方法，通过在表示插值增强方法的基础上构建数据的多样性，并将增强数据转换为标记来避免转移决策边界，提高了蒸馏的性能并在计算效率上具有优势。

Oct, 2022

Tied-Augment：控制表示相似度改进数据增强

提出一种称为Tied-Augment的通用框架，通过为损失添加一个简单的项来控制失真下表示的相似性，以提高数据增强在广泛应用中的效能，从而改善半监督学习，优化和数据增强方法的表现。

May, 2023

自动化机器学习中的数据增强：方法与传统数据增强方法的性能比较

该研究论文综述了基于自动机器学习（AutoML）原理的自动数据增强技术，讨论了利用AutoML实现数据增强的各种方法，包括数据操作、数据集成和数据合成技术，并对搜索空间设计、超参数优化和模型评估等数据增强子任务进行了广泛的讨论。最后，通过与传统增强方法基于经典方法的最新技术进行全面比较和分析，结果显示目前AutoML方法在数据增强方面的性能超过传统方法的最新技术。

Mar, 2024

AugmenTory: 一个快速灵活的多边形增强库

数据增强是解决有限数据集挑战的关键技术之一，本文介绍了新开发的AugmenTory库，该库相较于现有方法在时间和空间上具备较低的计算需求，并且包括后处理阈值特性。

May, 2024

数据增强综述

数据增强是一系列通过操作现有数据样本生成高质量人工数据的技术，利用数据增强技术可以显著提高人工智能模型在涉及稀缺或不平衡数据集的任务中的适用性，从而大大提高模型的泛化能力。本文提出了一个更具启发性的分类法，该分类法涵盖了不同常见数据形式的数据增强技术，并通过一种统一的归纳方法对这些方法进行了分类。

May, 2024

图像数据增强的扩散模型进展：方法、模型、评估指标和未来研究方向综述

图像数据增强在计算机视觉任务中是一种重要的方法，它可以增强训练数据集的多样性和质量，从而提高机器学习模型在下游任务中的性能和鲁棒性。本研究对基于扩散模型的图像增强方法进行了系统、全面、深入的综述，涵盖了广泛的策略、任务和应用。具体而言，首先对扩散模型的基本原理、模型架构和训练策略进行了全面分析。随后，引入了相关图像增强方法的分类方法，重点介绍了语义操作、个性化和适应性以及特定应用增强任务的技术。然后，分析了性能评估方法和相应的评估指标。最后，讨论了当前领域面临的挑战和未来的研究方向。

Jul, 2024