BriefGPT.xyz
大模型
Ask
alpha
关键词
spatial gradient scaling
搜索结果 - 1
ICLR
空间梯度缩放重参数化
本论文提出了一种新颖的空间梯度缩放方法,该方法根据特征映射的空间特征测量互信息,动态学习每个卷积层的缩放,并证明了空间梯度缩放实现了与分支再参数化相同的学习动态,同时不引入网络结构变化。实验结果表明,我们提出的缩放方法在不搜索再参数化结构的
→
PDF
a year ago
Prev
Next