ICMLMay, 2018

深度神经网络中激活函数的平均场理论

TL;DR本文提出了深度神经网络的统计力学模型,将基于能量的方法和前馈神经网络方法相连接。模型的平均场解给出了一组自然活化函数,包括 Sigmoid、tanh、ReLu 和 Swish,研究表明 Swish 可以优化网络的性能