Nov, 2016

残差网络的损失函数表面:集成和批归一化的作用

TL;DR本文表明深残差网络(Deep Residual Networks)可以视作一系列相对较浅网络的集合,并通过广义自旋玻璃模型分析其优化过程中的临界点数量及 Batch Normalization 技术等因素对网络深度动态变化的影响。