ICMLMay, 2018
深度神经网络中激活函数的平均场理论
Mean Field Theory of Activation Functions in Deep Neural Networks
Mirco Milletarí, Thiparat Chotibut, Paolo E. Trevisanutto
TL;DR本文提出了深度神经网络的统计力学模型,将基于能量的方法和前馈神经网络方法相连接。模型的平均场解给出了一组自然活化函数,包括 Sigmoid、tanh、ReLu 和 Swish,研究表明 Swish 可以优化网络的性能