关键词compression technique
搜索结果 - 9
  • LLM-QBench: 大型语言模型后训练量化最佳实践基准测试
    PDF2 months ago
  • 在神经压缩文本上训练 LLMs
    PDF3 months ago
  • SubGen: 子线时间和内存中的令牌生成
    PDF5 months ago
  • 相关量化用于更快的非凸分布式优化
    PDF6 months ago
  • 量化生成模型的 Softmax 偏差校正
    PDF10 months ago
  • 协作智能的神经网络特征张量轻量化压缩
    PDF3 years ago
  • EMNLP自然语言处理应用的排名和运行时感知压缩
    PDF4 years ago
  • ICLR深度推荐系统的优化:基于布隆嵌入的稀疏二元输入 / 输出网络
    PDF7 years ago
  • 通过剪枝压缩神经机器翻译模型
    PDF8 years ago
Prev
Next