关键词efficient deployment
搜索结果 - 8
- Xmodel-VLM: 一个简单的多模态视觉语言模型基准PDF2 months ago
- KV 缓存每通道 1 位:带耦合量化的高效大语言模型推断PDF2 months ago
- LLM 推理揭示:调查及屋顶线模型洞见PDF4 months ago
- DTMM:使用剪枝在极弱 IoT 设备上部署 TinyML 模型PDF6 months ago
- AAAI高效的去除天气影响多专家模型:基于不确定性感知的特征线性调制PDF6 months ago
- Q-YOLO:实时目标检测的高效推理PDFa year ago
- AWQ:激活感知权重量化用于低限制存储压缩和加速PDFa year ago
- 早期退出网络的自适应推断:设计、挑战与方向PDF3 years ago
Prev
Next