关键词efficient deployment
搜索结果 - 8
  • Xmodel-VLM: 一个简单的多模态视觉语言模型基准
    PDF2 months ago
  • KV 缓存每通道 1 位:带耦合量化的高效大语言模型推断
    PDF2 months ago
  • LLM 推理揭示:调查及屋顶线模型洞见
    PDF4 months ago
  • DTMM:使用剪枝在极弱 IoT 设备上部署 TinyML 模型
    PDF6 months ago
  • AAAI高效的去除天气影响多专家模型:基于不确定性感知的特征线性调制
    PDF6 months ago
  • Q-YOLO:实时目标检测的高效推理
    PDFa year ago
  • AWQ:激活感知权重量化用于低限制存储压缩和加速
    PDFa year ago
  • 早期退出网络的自适应推断:设计、挑战与方向
    PDF3 years ago
Prev
Next