BriefGPT.xyz
Ask
alpha
关键词
architecture design
搜索结果 - 23
Stackelberg GAN:通过多生成器结构实现可证明的极小极大均衡
通过新的架构设计,我们通过多种生成器体系结构缓解了 GAN 训练中的不稳定性问题,并通过 Shapley-Folkman 引理的新应用提出了一种新的 Stackelberg GAN,优于以前的多生成器 GAN,在基准数据集上比以前的方法提高
→
PDF
6 years ago
NIPS
哪些神经网络架构会导致梯度爆炸和梯度消失?
我们对一个使用 ReLU 激活的随机初始化全连接网络 N 的梯度统计行为进行了严格分析,发现其输出输入 Jacobian 的平方条目的经验方差呈现简单依赖架构的常数 beta 的指数形式,该常数由隐藏层宽度的倒数之和组成,当 beta 很大
→
PDF
6 years ago
深度卷积神经网络中有效感受野的理解
研究了深度卷积网络单元感受野的特性,提出了有效感受野的概念,并分析了它在几种架构设计中的作用,以及非线性激活、dropout、下采样和跳跃连接对其产生的影响。结果表明,这些因素对有效感受野的大小具有影响,并提出了一些解决途径。
PDF
7 years ago
Prev
Next