BriefGPT.xyz
大模型
Ask
alpha
关键词
sub-second
搜索结果 - 1
ICLR
SQuant: 基于对角 Hessian 近似的即时数据无关量化
本篇论文提出了一种名为 SQuant 的实时数据无需模型压缩框架,采用三对角线子项目组合构成新颖的无数据最优化目标解算法,同时设计了一个有效的算法来进一步减少目标求解的计算复杂度。实验结果表明,SQuant 不需要微调和合成数据集,可以将数
→
PDF
2 years ago
Prev
Next