BriefGPT.xyz
大模型
Ask
alpha
关键词
activation flow
搜索结果 - 1
训练二值化深度神经网络时规范激活分布
本文提出使用分布损失来规范激活流,成功改善了二值神经网络训练中遇到的退化、饱和和梯度失配等问题,并在不影响其能量效率的同时,提高了其准确性。此外,该规范化方法还能使训练过程更加稳健。
PDF
5 years ago
Prev
Next