关键词inference latency
搜索结果 - 53
  • 基于 NOMA 的移动边缘计算的高效推理加速算法
    PDF6 months ago
  • Emage: 非自回归式文本到图像生成
    PDF6 months ago
  • Packrat: 基于 CPU 的 DNN 服务的自动重新配置以降低延迟
    PDF7 months ago
  • 动态编码器早期退出的加速编码 - 解码 Transformer 模型
    PDF8 months ago
  • 高效译码的投机流水线执行
    PDF9 months ago
  • EMNLP使用哨兵标记对自回归 Transformer 进行上下文压缩
    PDF9 months ago
  • 利用聚焦卷积消除无关像素提高预训练 CNN 推理延迟和能效的自动化方法
    PDF9 months ago
  • MatFormer: 嵌套变压器用于弹性推理
    PDF9 months ago
  • EMNLP具备快速且稳健的同时并行解码的自回归语言模型提前退出框架
    PDF9 months ago
  • 通过半结构化激活稀疏化加速深度神经网络
    PDF10 months ago
  • RT-LM:面向实时推理的语言模型不确定性感知资源管理
    PDF10 months ago
  • 压缩视觉 Transformer 用于低资源视觉学习
    PDF10 months ago
  • RecycleGPT:一种带可循环模块的自回归语言模型
    PDFa year ago
  • A3D:边缘辅助飞行器的自适应、准确、自主导航
    PDFa year ago
  • ICMLUPSCALE: 无约束通道剪枝
    PDFa year ago
  • 移动应用的视觉 Transformer:简要概述
    PDFa year ago
  • CVPRAdaMTL: 面向高效多任务学习的自适应输入依赖推断
    PDFa year ago
  • LaSNN: 深度脉冲神经网络中的有效高效培训之层级 ANN 到 SNN 蒸馏
    PDFa year ago
  • 大小变压器解码器
    PDFa year ago
  • 大规模深度推荐模型的 GPU 专用推理参数服务器
    PDF2 years ago