Aug, 2020

深度学习训练终期神经崩溃的普遍存在

TL;DR训练深度网络的末期化训练(TPT)会导致神经坍塌现象,即最后一层训练激活的交叉示例内部变化降至零,导致分类器的决策简化为最近的类中心决策规则,然而这种对称且非常简单的几何结构具有更好的泛化性能,更好的稳健性和更好的可解释性。