关键词quantization
搜索结果 - 437
  • 联邦学习中量化的效果:一种以 Rényi 差分隐私为视角的研究
    PDFa day ago
  • 允许或禁止在量化网络之间转移对抗攻击的特性
    PDF2 days ago
  • 结合多种后训练技术实现最高效的量化 LLMs
    PDF5 days ago
  • SKVQ:用于大语言模型的滑动窗口键值缓存量化
    PDF7 days ago
  • LLM-QBench: 大型语言模型后训练量化最佳实践基准测试
    PDF8 days ago
  • ICMLDitto: 基于 MPC 的量化感知 Transformer 安全推理
    PDF8 days ago
  • QServe: W4A8KV4 量化和系统协同设计用于高效 LLM 服务
    PDF10 days ago
  • Trio-ViT:面向无 softmax 的高效视觉 Transformer 的后训练量化与加速
    PDF11 days ago
  • 量化 LLM 在规模和精度方面的能力
    PDF11 days ago
  • Torch2Chip: 用于原型硬件加速器设计的端到端可定制的深度神经网络压缩和部署工具包
    PDF15 days ago
  • 语音识别中的深度学习模型:GPU 能耗测量,噪声影响和边缘部署模型量化
    PDF15 days ago
  • ACL大型语言模型的量化对置信度的影响
    PDF16 days ago
  • 基于梯度的神经网络芯片上每权重混合精度量化
    PDF16 days ago
  • decoupleQ:通过将参数拆分为整数和浮点数实现 2-bit 后训练统一量化
    PDFa month ago
  • QGen:关于量化感知训练的泛化能力
    PDFa month ago
  • 视觉 Transformer 模型压缩与加速综述
    PDFa month ago
  • TMPQ-DM: 高效扩散模型的时间步减少和量化精度选择
    PDFa month ago
  • BinaryDM: 混合扩散模型的准确二值化
    PDFa month ago
  • ICLR研究量化对对抗性鲁棒性的影响
    PDFa month ago
  • 大卫与歌利亚:QNNs 在深度边缘的攻击和防御的实证评估
    PDFa month ago
Prev