Jan, 2022

GradMax:使用梯度信息生长神经网络

TL;DR本文介绍了一种名为GradMax的技术,可以在训练期间添加新的神经元而不影响已经学到的东西,同时提高训练动态,并通过奇异值分解(SVD)高效地找到最佳初始化,从而实现了网络架构优化的目的。