May, 2023

探索对比学习中的归纳偏置:一种聚类视角

TL;DR本文研究了对比学习和监督学习方法之间数据组织的差异,关注局部密集簇的概念。我们介绍了一种新的度量方法,相对局部密度(RLD), 用于量化簇内的局部密度。通过比较对比学习和监督学习形成的聚类,我们发现对比学习生成了没有全局密度的局部密集簇,而监督学习则生成了局部和全局密度的簇。我们进一步探讨了使用图卷积网络(GCN)分类器作为处理局部密集簇的线性分类器的替代方法。最后,我们利用 t-SNE 可视化来证明对比学习和监督学习方法生成的特征之间的差异。我们提出了未来的研究方向,包括开发针对对比学习进行优化的有效分类器和创新的增强算法。