Dec, 2022
通过预测网络和停梯度方法,实现BYOL/SimSiam的隐式方差正则化
Predictor networks and stop-grads provide implicit variance
regularization in BYOL/SimSiam
TL;DR本论文研究了自监督学习的非对比方法,通过构建 DirectPred 理论框架,分析了线性网络的表示学习动态,并通过共轭积的方法提供了一个显式的方差规则机制,提出了一种新的各向同性损失函数,并在 CIFAR-10 和 STL-10 数据集上证明了理论发现的正确性。