Sep, 2021

AutoInit: 神经网络分析信号保持的权重初始化

TL;DR本文介绍了一种自适应不同神经网络结构的权重初始化算法AutoInit,该算法通过跟踪信号传播时的均值和方差,适当地调整每层的权重,从而避免信号爆炸或消失。实验证明,AutoInit在各种激活函数、正则化、学习率和归一化设置下,都能提高卷积、残差和Transformer网络的性能,并比依赖数据的初始化方法更可靠。该算法的灵活性使其能够为各种规模的任务初始化模型,是神经架构搜索和激活函数发现等领域一种自动化配置工具,使新神经网络结构的设计更加鲁棒。AutoInit package提供了一个TensorFlow的封装,可在此 URL中获得。