ICMLJul, 2020
宽 - 窄:高效训练深瘦网络
Go Wide, Then Narrow: Efficient Training of Deep Thin Networks
Denny Zhou, Mao Ye, Chen Chen, Tianjian Meng, Mingxing Tan...
TL;DR本研究提出了一种基于模型压缩和神经平均场分析的新型深度学习网络优化方法,并通过大量实验证明其优于传统的反向传播方法,可使经过我们的优化方法训练后的 ResNet50 在性能上超越 ResNet101,而 BERT Base 则可以与 BERT Large 相媲美。