ICLRJan, 2021

重新审视本地监督学习:一种替代端到端训练的方法

TL;DR本文介绍了一种利用信息传播 (loss) 解决深度网络训练时存储中间激活值(activations)的大内存占用问题的算法,该算法将网络划分为局部模块,通过异步训练这些分离的局部模块,并且通过信息传播 (loss) 损失函数,逐层改进算法提高训练效率。