- 混合样本对特征学习的益处
本文研究数据增强方法 Mixup 的原理,从特征学习的角度解释了 Mixup 方法的优越性,并提出在早期训练阶段应用早停止技术以提高训练效果。
- ICLR使用 Mixup 进行过度训练可能损害泛化能力
通过线性插值的方法创建合成训练样例的 Mixup 是优化 SGD 的深度模型的简单而有效的正则化技术,本文显示 Mixup 训练中的 U 形泛化曲线现象, 通过一系列数据集的实验证明了混入嘈杂标签会让 Mixup 在合成数据中出现 U 形泛 - EMNLPSMSMix: 词义消歧的感知维护句子混淆
本论文提出了一种 Sense-Maintained Sentence Mixup (SMSMix) 的新型数据增强方法,维护特定词的含义并在 NLP 中应用 mixup 来提升数据集中稀有词义的准确性。在实验证明,该方法可以有效地提高数据增 - MixUp-MIL: 多实例学习的新型数据增强技术及甲状腺癌诊断研究
提出基于 MixUp 思想的多示例学习的数据扩充策略,对多示例学习和两个甲状腺癌数据集进行了详尽的研究,发现采用一种新的基于幻灯片内插值方法的策略可以提高准确性。
- 混合训练使领域泛化变得轻而易举
本文提出了一种基于 Mixup 的领域不变特征增强方法 (FIX) 和进一步增强判别能力的改进方法 (FIXED),在图像分类和时间序列分析等领域得到了广泛实验验证并成功提高测试精度。
- 利用中点混合在多视角数据中可以实现可证明学习多样性特征
该论文介绍了 Mixup 数据增强技术在图像分类方面的应用,从特征学习的角度解释了其成功的原因,并提供了实验证据支持其理论分析,证明其在处理具备多种特征的分类问题时效果良好。
- EMNLP多语言任务训练和推断中的翻译工件协同
本研究探讨在多语言任务中同时使用源语言和目标语言翻译数据的效果,并得出使用翻译工具造成的风格化翻译差异是提高性能的主要因素。此外,我们提出了一种名为 MUSC 的跨语言微调算法,该方法结合了 SupCon 和 MixUp,可以进一步提高多语 - MIXCODE: 基于 Mixup 的数据增强技术提升代码分类性能
本文提出了一种名为 MIXCODE 的数据增强方法,通过使用多个代码重构方法生成变换的代码,并使用 Mixup 技术将原始代码与变换后的代码混合以增加训练数据,从而在代码分类和缺陷检测等代码任务中有效地补充有效的训练数据,并使性能提高了 6 - ECCV黑盒少样本知识蒸馏
本文提出了一种黑盒少样本知识蒸馏方法,使用 MixUp 和条件变分自编码器生成多样的合成图像进行训练,显著优于最新 SOTA 的少 / 零样本 KD 方法用于图像分类任务。
- RegMixup:使用 Mixup 作为正则化器,出乎意料地可以提高精度和外部数据稳健性
利用 Mixup 作为标准交叉熵损失的额外正则化器,可以提高其精确度并在各种协变量转移和超出分布检测实验中显著提高其预测不确定性的质量。通过对视觉数据集 (ImageNet & CIFAR-10/100) 的深入分析和实验来展示我们的方法( - 全局混合:通过聚类消除歧义
提出基于全局聚类关系的新型数据扩增方法 ——Global Mixup,其中通过将先前的一阶段扩增过程分解为两阶段,从而将生成虚拟样本的过程与标记过程分离,并根据生成样本的全局关系计算子集对生成样本的标签重新标记,从而在更大的采样空间中生成更 - ACL基于数据制图的预训练语言模型 MixUp 技术
本文提出 TDMixUp 方法,利用训练动态,基于易于学习或模糊样本测量置信度、可变性、AUM 特征,让更具备信息量的样本相互插值,生成新样本,实验证明该方法不仅在较小的训练数据子集上取得竞争性能,而且在广泛的自然语言处理任务中,使用预训练 - ACL使用元重权的鲁棒自我增强命名实体识别
本论文研究使用自我增强技术以提高在低资源场景下命名实体识别 (NER) 的性能,提出了基于元反权重策略的统一 Token 替代和混合方法,可以在不增加特定增强方法的情况下提高 NER 的性能。
- 解耦混合数据增强用于高效学习
提出了一种新的混合数据方法 ——Decoupled Mixup,该方法可以将动态混合数据方法的样本解耦机制转移到目标函数级别,实现在保持数据平滑性的前提下焦点自适应聚焦于判别特征,避免了计算负担,并且实验结果表明 Decoupled Mix - ACL运用专家指导的对抗性扩充来提高命名实体识别的泛化能力
使用专家引导的启发式方法构建了一个高质量的 CoNLL 2003 测试数据集,通过基于此集合的对抗性扰动来评估 NER 模型的泛化能力,并且通过使用混合数据训练技术来显著提高在挑战集上的性能以及提高了域外泛化能力。
- AAAI基于模态自适应 Mixup 和不变分解的 RGB+IR 人员再识别方法
本文提出了一种新的模态自适应 Mixup 和不变分解方法(MID),以学习模态不变和具有鉴别力的表征,以应对 RGB - 红外人物再识别中由于 RGB 和红外图像之间的显着模态差异而产生的挑战,并在两个具有挑战性的基准测试上展示出了优越的性 - G-Mixup:图形分类的图数据增强
本研究开发了一种适用于图数据的 Mixup 方法,通过插值不同类别图的生成器以获得混合图,从而提高了图神经网络的泛化能力和鲁棒性。
- LINDA:自然语言处理中的无监督插值学习
本文提出了 ANI 算法,一种基于深度神经网络结构的无偏估计方法,解决了近邻法无法处理高维数据的问题,并在 MNIST 数据集和图像分类任务上的表现优于传统的平均法。
- AAAI针对少样本单视角三维重建的姿态自适应双 Mixup
本文提出了一种姿态自适应的 few-shot 学习方法以及两阶段数据插值规则,称为姿态自适应双混合(PADMix),用于单幅图像的 3D 重建,并在 ShapeNet 数据集上实现了显著优于先前文献的结果,并在更具挑战性的实际数据集 Pix - 使用场景无关混合增强辨别性视觉表示学习
本文研究了 MixUp 生成的目标函数,提出了一种包括自监督学习在内的 SAMix 算法解决该问题,并使用 Mixer 模型来避免在线训练的计算成本。实验证明,SAMix 表现卓越。