May, 2024

神经崩溃与低秩偏差:深度神经网络崩溃是否真正最优?

TL;DR深度神经网络中的神经塌缩现象对于非线性模型和多分类问题呈现低秩结构的突变是其优化的主要原因。