关键词quantization methods
搜索结果 - 19
  • LLMEasyQuant - 一个易于使用的 LLM 量化工具包
    PDF4 days ago
  • I-LLM:针对完全量化低位大型语言模型的高效整数推断
    PDFa month ago
  • PV-Tuning:用于极高 LLM 压缩的超越直通估计的方法
    PDFa month ago
  • 面向高效 DNN 推理的分布感知对数 Posit 编码算法硬件协同设计
    PDF4 months ago
  • IntactKV:通过保持关键标记完整来提高大型语言模型量化
    PDF4 months ago
  • 评估量化的大型语言模型
    PDF4 months ago
  • APTQ:针对大型语言模型的注意力感知后训练混合精度量化
    PDF4 months ago
  • 在分布式学习中管理重尾梯度的改进量化策略
    PDF5 months ago
  • 典型案例分析中的权重量化对模型学习的影响
    PDF5 months ago
  • ZeroQuant (4+2): 通过一种基于 FP6 的新策略重新定义 LLMs 量化,用于不同的生成任务
    PDF7 months ago
  • 可训练的等效转换:用于 LLMs 的量化
    PDF8 months ago
  • 高效的后训练量化与 FP8 格式
    PDF9 months ago
  • ICCV使用量化感知训练的高效神经 PDE 求解器
    PDFa year ago
  • 4 位精度的必要性:k 位推断缩放定律
    PDF2 years ago
  • ECCVPalQuant: 在低精度加速器上加速高精度网络
    PDF2 years ago
  • 后训练量化中的注意力轮
    PDF2 years ago
  • MM联邦学习上行和下行通信的设计与分析
    PDF4 years ago
  • EMNLPTernaryBERT: 知识蒸馏感知的超低比特 BERT
    PDF4 years ago
  • AdaptivFloat:一种基于浮点数的数据类型,用于弹性深度学习推理
    PDF5 years ago
Prev
Next