关键词inference latency
搜索结果 - 53
- 基于 NOMA 的移动边缘计算的高效推理加速算法PDF6 months ago
- Emage: 非自回归式文本到图像生成PDF6 months ago
- Packrat: 基于 CPU 的 DNN 服务的自动重新配置以降低延迟PDF7 months ago
- 动态编码器早期退出的加速编码 - 解码 Transformer 模型PDF8 months ago
- 高效译码的投机流水线执行PDF9 months ago
- EMNLP使用哨兵标记对自回归 Transformer 进行上下文压缩PDF9 months ago
- 利用聚焦卷积消除无关像素提高预训练 CNN 推理延迟和能效的自动化方法PDF9 months ago
- MatFormer: 嵌套变压器用于弹性推理PDF9 months ago
- EMNLP具备快速且稳健的同时并行解码的自回归语言模型提前退出框架PDF9 months ago
- 通过半结构化激活稀疏化加速深度神经网络PDF10 months ago
- RT-LM:面向实时推理的语言模型不确定性感知资源管理PDF10 months ago
- 压缩视觉 Transformer 用于低资源视觉学习PDF10 months ago
- RecycleGPT:一种带可循环模块的自回归语言模型PDFa year ago
- A3D:边缘辅助飞行器的自适应、准确、自主导航PDFa year ago
- ICMLUPSCALE: 无约束通道剪枝PDFa year ago
- 移动应用的视觉 Transformer:简要概述PDFa year ago
- CVPRAdaMTL: 面向高效多任务学习的自适应输入依赖推断PDFa year ago
- LaSNN: 深度脉冲神经网络中的有效高效培训之层级 ANN 到 SNN 蒸馏PDFa year ago
- 大小变压器解码器PDFa year ago
- 大规模深度推荐模型的 GPU 专用推理参数服务器PDF2 years ago