BriefGPT.xyz
Ask
alpha
关键词
deep neural collapse
搜索结果 - 3
神经崩溃与低秩偏差:深度神经网络崩溃是否真正最优?
深度神经网络中的神经塌缩现象对于非线性模型和多分类问题呈现低秩结构的突变是其优化的主要原因。
PDF
a month ago
深度线性无约束特征模型在深度学习中统一低维观测
现代深度神经网络在各种任务中取得了高性能,研究人员最近注意到这些网络的权重、Hessian 矩阵、梯度和特征向量中存在低维结构,这种低维结构在不同的数据集和架构上进行训练时都能观察到。在本文中,我们在理论上证明了这些观察结果的发生,并展示了
→
PDF
3 months ago
平均梯度外积:作为深度神经崩溃机制
Deep Neural Collapse(DNC)是深度神经网络(DNNs)中最终层数据表示的令人惊讶的刚性结构。本研究提供了实质性的证据,表明 DNC 主要通过平均梯度外积(AGOP)进行深度特征学习形成。我们证明了权重的右奇异向量和奇异
→
PDF
5 months ago
Prev
Next