May, 2023

激活函数的不激活:神经网络解释的合理理论

TL;DR本文提出了关于神经网络被认为具有高维空间模型但其空间的定义不够清晰的一个合理解释,即通过激活函数的作用将低维线性空间映射为无限维的高维空间,称为超空间。这种空间中的每个神经元节点通过激活层实际上是一个无限次幂的多项式,而训练神经网络可以至少简化为求解非线性方程组。