BriefGPT.xyz
大模型
Ask
alpha
关键词
quantized data types
搜索结果 - 1
混合专家混合精度神经网络的调优
通过添加新的数据类型到 Caffe,增加了现有商品电子设备上深度学习推断速度,在某些设备上,内存使用量可以降低到 3.29 倍,推断速度可以提高到 3.01 倍,并提出了一种混合专家模型的变化来增加图像分类中的推断速度。
PDF
2 years ago
Prev
Next