Oct, 2023

优秀表示的液滴:在两层网络中领悟为一阶相变

TL;DR深度神经网络在特征学习方面的能力,特别是与 Grokking 现象相关的阶段转变理论和预测,揭示出在训练过程中学习新特征的机制。