May, 2022

对比学习中更多的负样本一定会带来伤害吗?

TL;DR本文研究噪声对比估计中负样本数量与下游分类性能的关系,并在简单理论模型中表明,由于采样底层潜在类所导致的 “collision-coverage” 权衡,负样本数量不会影响(人口)对比损失所优化的表示。同时,给出了我们框架中最优表示的结构特征,为噪声对比估计提供了实证支持。