RSG: 一种用于学习不平衡数据集的简单而有效的模块

CVPRJun, 2021

RSG: 一种用于学习不平衡数据集的简单而有效的模块

RSG: A Simple but Effective Module for Learning Imbalanced Datasets

Jianfeng Wang, Thomas Lukasiewicz, Xiaolin Hu, Jianfei Cai, Zhenghua Xu

TL;DR本文旨在解决机器学习中不平衡数据集对深度神经模型训练带来的困难，提出了一种新的稀有类样本生成器来增加训练数据，经过大量实验验证，其有效性得到了证实，并在多个数据集上取得了领先效果。

Abstract

imbalanced datasets widely exist in practice and area great challenge for training deep neural models with agood generalization on infrequent classes. In this work, wepropose a new →

imbalanced datasets deep neural models rare-class sample generator convolutional neural network experimental evaluations

发现论文，激发创造

RareGAN: 生成罕见类别的样本

本研究提出了 RareGAN，一种新的合成方法，通过使用带标签和未标记数据进行更好的泛化，请求最有用的标签，以及加权损失函数来倾向于学习罕见类，解决了针对标签预算下罕见类非完全标记的数据集学习生成式对抗网络的问题，并在不同应用中实现了比以前更好的保真度和多样性权衡。

Mar, 2022

BSGAN: 一种用于不平衡模式识别的新型过采样技术

本文提出了一种结合 Borderline-Synthetic Minority Oversampling Techniques 和 Generative Adversarial Network 的混合过采样技术 (BSGAN)，并在四个高度不平衡的数据集上进行了测试，结果表明 BSGAN 在过采样效应后创建了一个更多元化的数据集，其表现优于存在的边界 SMOTE 和基于 GAN 的过采样技术。

May, 2023

SOS：针对表格数据的基于得分的过采样

本论文在以往 score-based generative models 成功生成虚假图像的基础上，自主研发了在 tabular data 数据集上使用的 score-based 过采样方法，该方法采用自有的 score network，提出了两种生成方法，进一步使用 fine-tuning 方法改进，实验证明在 6 个数据集上，该方法均能优于其他过采样方法。

Jun, 2022

软随机采样：理论和实证分析

软随机抽样（SRS）是一种简单而有效的方法，用于处理海量数据时高效训练大规模深度神经网络。本论文对 SRS 进行理论和实证分析，包括抽样动态、收敛性和泛化性能，以及在图像识别和自动语音识别等任务中的实证评估。相比现有的数据选择方法，SRS 在准确性和效率之间提供了更好的折衷，并在实际工业规模数据集上表现出显著加速和竞争性能，几乎不增加额外的计算成本。

Nov, 2023

基于 GSURE 的受损数据扩散模型训练

该研究提出了一种新的训练技术，基于受损数据训练扩散模型并引入 GSURE 损失函数。研究表明，在一定条件下，GSURE 损失函数相当于完全监督扩散模型中使用的训练目标，并可实现与完全监督模型相当的生成性能。

May, 2023

质量多样性生成抽样用于合成数据学习

通过质量 - 多样性生成抽样（QDGS）框架，我们可以生成均衡的合成数据集来训练分类器，从而提高公平性并保持面部识别基准的准确性。

Dec, 2023

一种基于混合采样的不平衡学习框架

研究提出了一种新型的样本采样算法，“SMOTE-RUS-NC”，它可以通过结合三种不同的采样技术来实现数据的平衡处理，进而提高分类算法的性能，特别是能够在高度不平衡的数据集中表现出卓越的效果。

Aug, 2022

Red-GAN: 通过有条件生成攻击类别不平衡 - 对皮肤镜检和脑部肿瘤 MRI 的医学图像合成的另一视角

通过基于生成对抗网络的数据增强协议，我们在像素级别和全局信息水平上对网络进行调节，以控制合成图像的外观，从而解决医学图像领域中被数据稀缺限制的问题，并通过将合成图像注入到训练集中来控制数据集类别的准确性水平。

Apr, 2020

深度生成对抗残差卷积网络用于真实世界超分辨率

通过提出一种深度残差卷积生成对抗网络（SRResCGAN）来解决真实世界中图像修复过程缺失的问题，该网络通过对 HR 领域的像素级监督来对模型进行敌对训练，并利用残差学习和凸优化技术来最小化能量函数，我们的实验表明，该方法易于部署到其他下采样算子和移动 / 嵌入式设备上，并且能够更好地适应真实世界中的图像噪声问题。

May, 2020

实际场景超分辨率的频率分离

使用 DSGAN 结构进行无监督学习，将自然图像特征引入通过双三次下采样降级的图像。通过频率分离技术，只需对高频部分进行对抗性训练，从而极大地提高超分辨率模型在真实世界图像上的性能表现。

Nov, 2019