May, 2023

关于激活和标准化对于初始情况下获得等距嵌入的影响

TL;DR该论文探讨了深度神经网络中的 Gram 矩阵结构,在多层感知器中给出了层归一化与激活层一起导致 Gram 矩阵趋向等距的证明,进一步阐明了高阶 Hermite 系数在此方面的重要性。