Feb, 2024

神经排序崩溃:权重衰减和小的内类变异性带来低秩偏差

TL;DR深度学习中的低秩偏好与神经网络的神经层塌陷现象相关,权重衰减参数的增长导致网络中每一层的秩与前一层隐藏空间嵌入的类内变异成正比减少。