关键词compression technique
搜索结果 - 9
- LLM-QBench: 大型语言模型后训练量化最佳实践基准测试PDF2 months ago
- 在神经压缩文本上训练 LLMsPDF3 months ago
- SubGen: 子线时间和内存中的令牌生成PDF5 months ago
- 相关量化用于更快的非凸分布式优化PDF6 months ago
- 量化生成模型的 Softmax 偏差校正PDF10 months ago
- 协作智能的神经网络特征张量轻量化压缩PDF3 years ago
- EMNLP自然语言处理应用的排名和运行时感知压缩PDF4 years ago
- ICLR深度推荐系统的优化:基于布隆嵌入的稀疏二元输入 / 输出网络PDF7 years ago
- 通过剪枝压缩神经机器翻译模型PDF8 years ago
Prev
Next