Feb, 2024

深度均衡模型与不那么深的显式模型在高维高斯混合模型中几乎等效

TL;DR使用随机矩阵理论,对深度平衡模型的特征频谱进行深入分析,证明了隐式 CK 和 NTK 的谱行为取决于激活函数和初始权重方差,从而可以通过一个浅层显式网络来设计出相同的 CK 或 NTK。