Sep, 2023

失败模式的三重困境及可能的出路

TL;DR我们提出了一种针对基于聚类的自主学习(SSL)的全新客观函数,旨在解决表示坍塌、聚类坍塌和集群分配排列不变性等三种失败模式的问题。我们的目标函数包含三个关键组成部分:(i)惩罚表示坍塌的生成项,(ii)促进对数据增强的不变性,从而解决标签排列问题,以及(ii)惩罚聚类坍塌的一致性项。此外,我们的目标函数具有两个值得注意的优点:首先,从贝叶斯的角度来看,它可视为数据对数似然的下界。其次,它可以训练标准的主干架构,无需使用诸如停止梯度、动量编码器或专门的聚类层等非对称元素。通过其简洁性和理论基础,我们提出的目标函数非常适合优化。在玩具数据和实际数据的实验中证明了其有效性。