Jun, 2019

链式法则的链接:多级熵正则化与神经网络的训练

TL;DR文章提出了一种基于多级相对熵的复杂度量家族,导出了神经网络的泛化和过剩风险界,并利用多级结构解决了经验风险最小化问题,并提出了基于 Gibbs 后验分布的新的带有性能保证的神经网络训练过程。