关键词quantization
搜索结果 - 437
- 联邦学习中量化的效果:一种以 Rényi 差分隐私为视角的研究PDFa day ago
- 允许或禁止在量化网络之间转移对抗攻击的特性PDF2 days ago
- 结合多种后训练技术实现最高效的量化 LLMsPDF5 days ago
- SKVQ:用于大语言模型的滑动窗口键值缓存量化PDF7 days ago
- LLM-QBench: 大型语言模型后训练量化最佳实践基准测试PDF8 days ago
- ICMLDitto: 基于 MPC 的量化感知 Transformer 安全推理PDF8 days ago
- QServe: W4A8KV4 量化和系统协同设计用于高效 LLM 服务PDF10 days ago
- Trio-ViT:面向无 softmax 的高效视觉 Transformer 的后训练量化与加速PDF11 days ago
- 量化 LLM 在规模和精度方面的能力PDF11 days ago
- Torch2Chip: 用于原型硬件加速器设计的端到端可定制的深度神经网络压缩和部署工具包PDF15 days ago
- 语音识别中的深度学习模型:GPU 能耗测量,噪声影响和边缘部署模型量化PDF15 days ago
- ACL大型语言模型的量化对置信度的影响PDF16 days ago
- 基于梯度的神经网络芯片上每权重混合精度量化PDF16 days ago
- decoupleQ:通过将参数拆分为整数和浮点数实现 2-bit 后训练统一量化PDFa month ago
- QGen:关于量化感知训练的泛化能力PDFa month ago
- 视觉 Transformer 模型压缩与加速综述PDFa month ago
- TMPQ-DM: 高效扩散模型的时间步减少和量化精度选择PDFa month ago
- BinaryDM: 混合扩散模型的准确二值化PDFa month ago
- ICLR研究量化对对抗性鲁棒性的影响PDFa month ago
- 大卫与歌利亚:QNNs 在深度边缘的攻击和防御的实证评估PDFa month ago
Prev