BriefGPT.xyz
Ask
alpha
关键词
sparse weights
搜索结果 - 2
MLP-Mixer 作为一个宽且稀疏的多层感知机
本文研究了多层感知机,重点探究了其深化效果和改进方法。其中提出了 MLP-Mixer 与宽 MLP 具有稀疏权重的相关性,并从预测性能优化的角度进行了实验验证。
PDF
a year ago
量化感知训练中的通道修剪:自适应投影梯度下降缩减分裂方法
提出了一种自适应投影 - 梯度下降收缩分割方法 (APGDSSM),该方法将基于惩罚的通道剪枝集成到量化感知训练 (QAT) 中。APGDSSM 同时搜索量化子空间和稀疏子空间中的权重,并使用收缩算子和分割技术创建稀疏权重,以及使用 Gro
→
PDF
2 years ago
Prev
Next