ICLRMay, 2021

分解神经层的初始化和正则化

TL;DR研究深度学习中出现的因子化层,并探讨如何通过谱初始化和 Frobenius 衰减来改善它们的性能,并在模型压缩和知识蒸馏领域进行了实验。