Aug, 2023

多变体划分混合:一种用于严重标签噪声的半监督对比学习框架

TL;DR本文提出了一种基于自监督训练的方法,通过利用所有训练数据的信息,为每个样本提取有意义且可泛化的嵌入空间,从而去除 out-of-distribution 样本,并使用迭代的 Manifold DivideMix 算法找到干净和有噪音的样本,以半监督的方式训练模型。此外,我们还提出了一种名为 MixEMatch 的半监督算法,其中包括在模型的输入和最终隐藏表示中进行 mixup 增强,通过在输入和流形空间进行插值提取更好的表示。对多个合成噪声图像基准和真实世界的网络爬取数据集进行的广泛实验证明了我们提出的框架的有效性。代码可在此 https URL 找到。