BriefGPT.xyz
大模型
Ask
alpha
关键词
sparse mask
搜索结果 - 4
初始化剪枝:基于草图视角
研究了在线性设置中用于剪枝神经网络的 lottery ticket hypothesis (LTH),发现找到一个稀疏的 mask 等价于为高效矩阵乘法引入的 sketching 问题,并以此作为工具来分析 LTH 问题并提出通用改进算法。
PDF
a year ago
ACL
无需增加延迟的参数高效微调
本文提出了一种任务不可知的生成稀疏掩码的方法,仅使用预训练参数的振幅信息,可以显著提高性能和存储效率,并引入了一种新颖的适配器技术,可以直接应用于预训练参数,与全细调速度相同。
PDF
a year ago
使用稀疏本地模型实现个性化联邦学习
本论文提出一种名为 FedSpa 的新型 PFL 方案,它采用个性化稀疏掩码来在边缘上自定义稀疏的本地模型,理论和实验表明,FedSpa 不仅节省了通信和计算成本,而且在模型准确性和收敛速度方面表现优异。
PDF
2 years ago
使用固定稀疏掩码训练神经网络
本文提出了种方法,在深度神经网络的训练过程中,仅更新极少参数,通过一个由具有最大 Fisher 信息的 k 个参数组成的稀疏掩码选择一个参数子集进行多次迭代更新。实验证明,该方法在参数有效转移学习和分布式训练方面的表现可与其他方法相匹配或超
→
PDF
3 years ago
Prev
Next