Dec, 2020

交叉熵损失下的神经崩溃

TL;DR研究了在 R^d 的单位超球面上具有 n 个特征向量的交叉熵损失函数的变分问题,证明了当 d≥n-1 时,全局最小值由等角张紧四面体框架给出,证明了神经网络崩塌的行为,并证明了随着 n 趋向于无穷大而点的最小化将在超球面上均匀分布,并展示了与 Benedetto&Fickus 的框架潜力的联系。