BriefGPT.xyz
大模型
Ask
alpha
关键词
quantization algorithms
搜索结果 - 3
可部署的 LLM 压缩加速之旅
通过硬件为中心的方法,我们的压缩方法在硬件加速的基础上构建了一种新的 W4A8 内核实现,具有量化策略的综合配方,通过广泛的实验证明了我们的 W4A8 方法对于 Hugging Face FP16 推断的实际加速效果为 4 倍,对于 Ten
→
PDF
8 months ago
ICLR
DAdaQuant:用于通信高效联邦学习的双重自适应量化
本研究介绍了一种动态自适应的量化算法 DAdaQuant,可以在保证模型质量的前提下提高 client 到 server 的压缩比例,比强非自适应基线算法提高多达 2.8 倍。
PDF
3 years ago
关于分类的分布式量化
本文提出了一种分布式量化方案,旨在用训练数据为分类器设计量化器,不需要先验数据假设,而是专注于正确分类,可在任何特征数、任何类别数和任意特征分布的情况下进行多项式时间量化算法的设计。结果表明,将量化器适应于分类任务可以获得显着的节省,并可在
→
PDF
5 years ago
Prev
Next