AugLy: 针对鲁棒性的数据增强技术
Augmnety 是一个构建在 spaCy 之上用于结构化文本增强的 Python 库,提供了一系列增强器,可以灵活地组合以创建复杂的增强流程,包括词替换增强器等自定义增强器,适用于命名实体识别(NER)、词性标注和依赖解析等多个应用领域。
Dec, 2023
数据增强是解决有限数据集挑战的关键技术之一,本文介绍了新开发的 AugmenTory 库,该库相较于现有方法在时间和空间上具备较低的计算需求,并且包括后处理阈值特性。
May, 2024
本文介绍了 NL-Augmenter—— 一个基于 Python 的自然语言增强框架,支持创建转换和筛选器,同时提供 117 个转换和 23 个筛选器,以增强模型中的数据。我们演示了 NL-Augmenter 的有效性,并使用其转换来分析流行的自然语言模型的鲁棒性。
Dec, 2021
Augmentor 是一个 Python 和 Julia 版本的软件包,使用基于管道的随机方法对现有观察数据进行数据增强,并提供大量常用机器学习数据增强任务的助手函数和多种高级特性。
Aug, 2017
通过使用 RandAug 的音频版本 AudRandAug 来进行音频数据增强,本研究表明 AudRandAug 在准确性能方面优于其他现有的数据增强方法。
Sep, 2023
本文研究对抗训练的过拟合问题,提出利用数据增强和生成模型增加训练集大小,提高对抗鲁棒性,并在 CIFAR-10 数据集上取得最新成果,其中对于 Ε=8/255 的 l∞规范扰动,模型不使用外部数据时达到 64.20%的鲁棒准确性,超过了大多数先前使用外部数据的研究成果。
Mar, 2021
本文提出了 GraphAug,一种自动化的数据增强方法,通过采用基于强化学习的训练方法最大化预测的标签不变概率,可以在大多数时候产生标签不变性数据增强,并在不同的图分类任务中优于以前的图增强方法。
Feb, 2022
AugMax 是一种数据增强框架,旨在将 DNNs 的鲁棒性的多样性和难度两个方面统一起来。 AugMax 首先随机采样多个增强算子,然后学习所选算子的对抗性混合。 为了解决模型训练更具挑战性的问题,作者进一步设计了一种名为 DuBIN 的解耦归一化模块。 它可以解决由 AugMax 引起的不同实例间特征异质性的问题,并且比现有技术在 CIFAR10-C,CIFAR100-C,Tiny ImageNet-C 和 ImageNet-C 上的超出分布鲁棒性方面表现更好。
Oct, 2021
本文提出了一种基于敌对样本的选择性、动态并且与检测器演化相关的数据扩增方法,该方法适用于目标检测模型,能够大幅提高模型的鲁棒性和检测精度。与基于模型无关的自动增广方法相比,在不同的检测模型中,该方法表现更加广泛和稳健。
Mar, 2021
本研究提出了一种名为 Reinforcement Learning with Augmented Data 的加强数据的强化学习算法,将图像数据进行数据增强、使用深度神经网络等算法,提取出了数据效率、推广性等方面的关键特征。实验结果表明,该算法可以在 DeepMind 和 OpenAI Gym 等常见测试用例中优于当前最先进的算法。
Apr, 2020