RSG: 一种用于学习不平衡数据集的简单而有效的模块
本研究提出了 RareGAN,一种新的合成方法,通过使用带标签和未标记数据进行更好的泛化,请求最有用的标签,以及加权损失函数来倾向于学习罕见类,解决了针对标签预算下罕见类非完全标记的数据集学习生成式对抗网络的问题,并在不同应用中实现了比以前更好的保真度和多样性权衡。
Mar, 2022
本文提出了一种结合 Borderline-Synthetic Minority Oversampling Techniques 和 Generative Adversarial Network 的混合过采样技术 (BSGAN),并在四个高度不平衡的数据集上进行了测试,结果表明 BSGAN 在过采样效应后创建了一个更多元化的数据集,其表现优于存在的边界 SMOTE 和基于 GAN 的过采样技术。
May, 2023
本论文在以往 score-based generative models 成功生成虚假图像的基础上,自主研发了在 tabular data 数据集上使用的 score-based 过采样方法,该方法采用自有的 score network,提出了两种生成方法,进一步使用 fine-tuning 方法改进,实验证明在 6 个数据集上,该方法均能优于其他过采样方法。
Jun, 2022
软随机抽样(SRS)是一种简单而有效的方法,用于处理海量数据时高效训练大规模深度神经网络。本论文对 SRS 进行理论和实证分析,包括抽样动态、收敛性和泛化性能,以及在图像识别和自动语音识别等任务中的实证评估。相比现有的数据选择方法,SRS 在准确性和效率之间提供了更好的折衷,并在实际工业规模数据集上表现出显著加速和竞争性能,几乎不增加额外的计算成本。
Nov, 2023
该研究提出了一种新的训练技术,基于受损数据训练扩散模型并引入 GSURE 损失函数。研究表明,在一定条件下,GSURE 损失函数相当于完全监督扩散模型中使用的训练目标,并可实现与完全监督模型相当的生成性能。
May, 2023
研究提出了一种新型的样本采样算法,“SMOTE-RUS-NC”,它可以通过结合三种不同的采样技术来实现数据的平衡处理,进而提高分类算法的性能,特别是能够在高度不平衡的数据集中表现出卓越的效果。
Aug, 2022
通过基于生成对抗网络的数据增强协议,我们在像素级别和全局信息水平上对网络进行调节,以控制合成图像的外观,从而解决医学图像领域中被数据稀缺限制的问题,并通过将合成图像注入到训练集中来控制数据集类别的准确性水平。
Apr, 2020
通过提出一种深度残差卷积生成对抗网络(SRResCGAN)来解决真实世界中图像修复过程缺失的问题,该网络通过对 HR 领域的像素级监督来对模型进行敌对训练,并利用残差学习和凸优化技术来最小化能量函数,我们的实验表明,该方法易于部署到其他下采样算子和移动 / 嵌入式设备上,并且能够更好地适应真实世界中的图像噪声问题。
May, 2020
使用 DSGAN 结构进行无监督学习,将自然图像特征引入通过双三次下采样降级的图像。通过频率分离技术,只需对高频部分进行对抗性训练,从而极大地提高超分辨率模型在真实世界图像上的性能表现。
Nov, 2019