关键词efficient inference
搜索结果 - 19
  • Mamba 或 RWKV:探索高质量和高效率的分段任意模型
    PDF7 days ago
  • D2O: 大规模语言模型高效生成推理的动态判别操作
    PDF16 days ago
  • 签名二进制化:通过重复稀疏化的效率优化
    PDF7 months ago
  • MMAdaBrowse: 自适应视频浏览器以提高连续手语识别效率
    PDFa year ago
  • 单调深度玻尔兹曼机
    PDFa year ago
  • Flover: 一种用于高效自回归模型并行推理的时空融合框架
    PDFa year ago
  • Transformer 推理的全栈优化:一项调查
    PDFa year ago
  • FP8 量化:指数的力量
    PDF2 years ago
  • KDDM6-Rec: 生成预训练语言模型是开放式推荐系统
    PDF2 years ago
  • Continual Inference: 一个在 PyTorch 中使用深度神经网络进行高效在线推断的库
    PDF2 years ago
  • ICCV通过归因排名保护实现通用混合精度量化
    PDF3 years ago
  • 深度神经网络的完全动态推断
    PDF4 years ago
  • 快速稀疏卷积神经网络
    PDF5 years ago
  • ICLROnce-for-All: 训练一个网络并为其专门优化以实现高效部署
    PDF5 years ago
  • EMNLP标记词之间的空隙:使用提及分隔符识别重叠提及
    PDF6 years ago
  • 使用词嵌入的非参数球形主题建模
    PDF8 years ago
  • Hamiltonian 大脑:利用兴奋抑制神经电路动态的高效概率推断
    PDF10 years ago
  • 学习具有观测或潜在 FVS 的高斯图模型
    PDF11 years ago
  • 基于曲率先验的 MRF 分割和形状修复
    PDF13 years ago
Prev
Next