关键词quantization methods
搜索结果 - 19
- LLMEasyQuant - 一个易于使用的 LLM 量化工具包PDF4 days ago
- I-LLM:针对完全量化低位大型语言模型的高效整数推断PDFa month ago
- PV-Tuning:用于极高 LLM 压缩的超越直通估计的方法PDFa month ago
- 面向高效 DNN 推理的分布感知对数 Posit 编码算法硬件协同设计PDF4 months ago
- IntactKV:通过保持关键标记完整来提高大型语言模型量化PDF4 months ago
- 评估量化的大型语言模型PDF4 months ago
- APTQ:针对大型语言模型的注意力感知后训练混合精度量化PDF4 months ago
- 在分布式学习中管理重尾梯度的改进量化策略PDF5 months ago
- 典型案例分析中的权重量化对模型学习的影响PDF5 months ago
- ZeroQuant (4+2): 通过一种基于 FP6 的新策略重新定义 LLMs 量化,用于不同的生成任务PDF7 months ago
- 可训练的等效转换:用于 LLMs 的量化PDF8 months ago
- 高效的后训练量化与 FP8 格式PDF9 months ago
- ICCV使用量化感知训练的高效神经 PDE 求解器PDFa year ago
- 4 位精度的必要性:k 位推断缩放定律PDF2 years ago
- ECCVPalQuant: 在低精度加速器上加速高精度网络PDF2 years ago
- 后训练量化中的注意力轮PDF2 years ago
- MM联邦学习上行和下行通信的设计与分析PDF4 years ago
- EMNLPTernaryBERT: 知识蒸馏感知的超低比特 BERTPDF4 years ago
- AdaptivFloat:一种基于浮点数的数据类型,用于弹性深度学习推理PDF5 years ago
Prev
Next