Aug, 2022

失衡问题:重新审视神经陷入坍塌的几何特性

TL;DR本文通过使用无限制特征模型和引入Simplex编码标签插值(SELI)作为神经坍塌现象的不变特征,证明了在使用交叉熵损失和消失正则化时,不受类别不平衡的影响,分类器总是插值出一个Simplex编码标签矩阵,而它们的几何形状取决于相同标签矩阵的SVD因子。同时,实验结果也表明收敛速度会随着类别不平衡的增加而变慢,并证明正则化对于修正分类器的几何形状也有着至关重要的作用。