BriefGPT.xyz
大模型
Ask
alpha
关键词
int8 quantization
搜索结果 - 3
基于 Llama.cpp 的 Armv9 架构通用大语言模型推理性能优化
通过进行 Int8 量化,对 llama.cpp 中的一些运算符进行矢量化,并修改编译脚本以提高编译器优化水平,优化了 Qwen-1.8B 模型的推断性能。在 Yitian 710 实验平台上,填充性能提高了 1.6 倍,解码性能提高了 2
→
PDF
18 days ago
SmoothQuant:大型语言模型后训练量化的准确高效算法
SmoothQuant 是一个训练免费的精度保持、通用的后训练量化解决方案,用于大型语言模型(LLMs),通过平滑激活异常值并在权重和激活之间进行数学上等效的变换以迁移量化难度,可以实现 LLMs 的 8 位权重和激活(W8A8)量化,同时
→
PDF
2 years ago
AAAI
分布自适应 INT8 量化用于训练 CNNs
本文提出了一种新的 INT8 量化训练框架,其中采用梯度矢量化量化梯度,并引入基于梯度幅度的裁剪策略来解决量化梯度的误差,实验结果表明,在图像分类、物体检测和视频分类等广泛的计算机视觉任务中,所提出的 Distribution Adapti
→
PDF
3 years ago
Prev
Next