反例引导的数据增强

May, 2018

Counterexample-Guided Data Augmentation

Tommaso Dreossi, Shromona Ghosh, Xiangyu Yue, Kurt Keutzer, Alberto Sangiovanni-Vincentelli...

TL;DR提出一种新的基于反例的机器学习数据集增强框架，使用反例数据生成器和错误表等关键组件改进模型的分类性能，在深度神经网络的自动驾驶目标检测案例研究中表现出较高效果。

Abstract

We present a novel framework for augmenting data sets for machine learning based on counterexamples. →

发现论文，激发创造

本研究提出一种生成无监督模型的对抗性示例的框架，使用相互信息神经估计器作为无监督信息理论相似度测量，建议使用此框架将对抗性样本作为简单的插入数据增强工具进行模型再训练，以大幅提高在不同无监督任务和数据集上的性能。

Mar, 2021

使用对照例子作为监督信号，改进深度学习的训练方法，提高神经网络的泛化能力及性能。

Apr, 2020

利用对抗生成和微调的新方法来减轻计算机视觉模型中的偏见，通过使用欺骗深度神经网络但不欺骗人类的对抗图像作为反事实进行公正模型训练，通过 qualitatively 和 quantitatively 的评估证明了相比于现有方法，我们的方法实现了改进的偏见减轻和准确性。

Apr, 2024

提出了一种基于贝叶斯公式，利用广义蒙特卡洛期望最大化算法和生成对抗网络的方法，能更好地生成新的标注训练样本，并在 MNIST，CIFAR-10 和 CIFAR-100 的数据集中取得了优于现有数据增强方法和 GAN 模型的分类结果。

Oct, 2017

研究机器学习中的公平性问题和图像分类任务中的去偏见问题，通过使用对抗性样本进行训练数据增强来实现模型的准确性和公平性。

Jul, 2020

该论文分析了对训练重建网络起到贡献的模拟异常的关键特征，并基于这些特征提出了综合框架，结合重建方法和分离训练策略，解决了过拟合问题并避免干扰重建过程，评估结果表明该方法在对象类别方面优于现有方法，并证明其在真实场景下遇到各种意外异常具有良好的潜力。

Aug, 2023

本文提出了一种理论框架，证明了数据增强等效于对保持数据分布近似不变的某一群轨道的平均操作，从而能够减少方差，研究了经验风险最小化、指数族、线性回归和某些双层神经网络这些领域中数据增强的应用。

Jul, 2019

该论文提出了一种新的框架，通过语言引导生成对抗图片来加强分类模型。通过使用对抗图片数据集来测试模型的弱点，并将对抗图片作为增加的数据集来微调和加固分类模型，研究揭示了使用小规模对抗图片进行微调可以有效增强模型的性能。

Jun, 2024

提出了一种新的数据增强技术，结合因果推理和主动学习，根据不确定性区域选择有用的对照样本来最大化模型对未知测试数据的泛化，实验表明，在准确率和 AUC 方面，这种方法在多个现实世界的表格数据集上显著优于基线。

Jul, 2022

本研究提出了利用反事实数据扩充改善机器学习模型中混淆偏差的方法，并探讨了混淆偏差如何影响下游分类器以及基于反事实数据增强的解决方案。另外，我们还介绍了一种生成反事实图片的算法，并在 MNIST 变量和 CelebA 数据集上进行实验，证明了我们的方法的有效性和实用性。

May, 2023