BriefGPT.xyz
Ask
alpha
关键词
data quantization
搜索结果 - 2
超定基的大型语言模型的量化
基于 Kashin 表示原理,我们引入了一种数据量化算法,通过将给定的向量、矩阵或张量分解为两个因子,其中第一个因子具有小的无穷范数,而第二个在乘以正交矩阵后也具有相似的限制范数。通过分解后的因子条目意外地集中在几个峰值附近,允许我们有效地
→
PDF
3 months ago
基于分块动态精度神经网络培训加速的在线量化敏感性分析
提出了一种动态精度神经网络训练框架 DYNASTY,通过快速在线分析提供准确的数据敏感度信息并通过自适应位宽映射生成器维持稳定的训练收敛性,与传统 8 位量化相比,DYNASTY 在 CIFAR-100 和 ImageNet 数据集上带来高
→
PDF
2 years ago
Prev
Next