关键词quantization
搜索结果 - 402
  • FlattenQuant: 通过 Per-tensor 量化来突破大型语言模型的推断计算限制
    PDF4 days ago
  • 使用决策变换器进行四足动物运动的微型强化学习
    PDF12 days ago
  • DB-LLM:用於高效 LLMs 的準確雙二元化
    PDF13 days ago
  • WKVQuant:量化权重和键 / 值缓存以提升大型语言模型的性能
    PDF13 days ago
  • 预训练中去除异常值是一餐免费午餐吗?
    PDF13 days ago
  • 任意精度 LLM:低成本部署多个不同大小的 LLM
    PDF16 days ago
  • EdgeQAT:基于熵和分布的量化感知训练用于边缘轻量级语言模型加速
    PDF16 days ago
  • 可控扩散语言模型的量化嵌入向量
    PDF17 days ago
  • 大型语言模型的模型压缩与高效推理:调研
    PDF17 days ago
  • ApiQ: 2 位量化大型语言模型的精调
    PDF25 days ago
  • QuEST: 低比特扩散模型量化的高效选择性微调
    PDFa month ago
  • Transformer 压缩综述
    PDFa month ago
  • KIVI:一种用于 KV 缓存的无需调节的非对称 2 位量化
    PDFa month ago
  • 最佳和近似最佳的自适应矢量量化
    PDFa month ago
  • 从循环神经网络进行的各种符号规则提取方法的稳定性分析
    PDFa month ago
  • FedShift: 通过权重偏移聚合解决联邦学习的双重异质问题
    PDFa month ago
  • 可训练的固定点量化用于在 FPGA 上加速深度学习
    PDFa month ago
  • KVQuant: 通过 KV 缓存量化实现 1000 万上下文长度的 LLM 推断
    PDFa month ago
  • 语言模型压缩算法综述
    PDFa month ago
  • 深度网络中使用较低位宽累加器实现更廉价的推理
    PDFa month ago
Prev