Oct, 2019

均方根层标准化

TL;DR该论文介绍了 RMSNorm 和 pRMSNorm,这是相对于对传统的 LayerNorm 进行改进,可使神经网络模型更具有稳定性和更快的收敛能力,同时保持了输入重新缩放的不变性,通过实验证明,RMSNorm 可以在不降低性能的情况下显著减少计算成本。