BriefGPT.xyz
大模型
Ask
alpha
关键词
inference hardware
搜索结果 - 2
SqueezeNAS:用于更快语义分割的快速神经架构搜索
本研究采用无代理的硬件感知搜索方法,针对密集的语义分割任务,实现了特定任务和推理硬件上优化的网络,并在 Cityscapes 语义分割数据集上实现了最先进的网络准确度优化,在 NVIDIA AGX Xavier 上实现了低于 100ms 推
→
PDF
5 years ago
Facebook 数据中心中的深度学习推理:特征描述、性能优化和硬件影响
本文详细介绍了 Facebook 社交网络服务中使用的深度学习模型的计算特征,并描述了针对现有系统的高性能优化,同时指出了其局限性,并为未来的通用 / 加速推理硬件提出建议。此外,我们强调了算法、数字和计算平台更好的协同设计来解决数据中心中
→
PDF
6 years ago
Prev
Next