BriefGPT.xyz
大模型
Ask
alpha
关键词
activation
搜索结果 - 4
前向前向算法中稀疏性的理论
本研究论文探讨解释了前向传播算法中观察到的高稀疏现象,并提出了两个定理来预测单个数据点的激活稀疏性变化,该理论与在 MNIST 数据集上进行的实验结果相吻合。
PDF
8 months ago
通过半结构化激活稀疏化加速深度神经网络
通过在计算通用矩阵乘法(GEMM)时考虑激活的最终位置,我们设计了一种稀疏训练过程,以诱导可利用的半结构化激活稀疏性,并在图像分类和目标检测任务中对其进行了广泛评估,结果显示在 ImageNet 数据集上,我们的方法在 ResNet18 模
→
PDF
10 months ago
ICLR
通过通道级激活抑制来提高对抗性鲁棒性
本文从渠道角度分析对抗 perturbations 特性,提出了一种基于通道的抑制策略 (CAS) 用于训练一个本质上抑制对抗激活的模型,进一步改善现有防御方法的鲁棒性。
PDF
3 years ago
ICML
通过传播激活差异学习重要特征
DeepLIFT 是一种通过反向传播将神经网络对特定输入的输出预测分解为网络中所有神经元对每个输入特征的贡献的方法,可用于提高网络解释性并有助于揭示其他方法中可能被忽略的依赖关系。
PDF
7 years ago
Prev
Next