Feb, 2024

梯度下降法在深度非线性网络中导致权重与经验NTK之间的对齐

TL;DR神经网络从输入-标签对中提取统计数据的机制是监督学习中最重要的未解决问题之一。我们通过解释神经特征假设(NFA)的出现来揭示了这种关联的原因,并且提出了一种简单的干预方法来提高NFA关联性,从而显著改善学习到的特征的质量。