ICMLMay, 2023

对比学习中学习了哪些特征?简单偏置在类崩溃和特征抑制中的作用

TL;DR本文提供了第一个统一的理论框架,旨在确定对比学习 (CL) 学习了哪些特征。我们的分析表明,(随机) 梯度下降向查找更简单解决方案的偏见是导致子类表示崩溃和抑制更难的类相关特征的关键因素。此外,我们提出了增加嵌入维度和提高数据增强质量作为两个理论动机解决 {特征抑制}。我们还首次理论解释了为什么同时使用监督和无监督 CL 会产生更高质量的表示,即使用常用的随机梯度方法。