Sep, 2022

混合专家混合精度神经网络的调优

TL;DR通过添加新的数据类型到 Caffe,增加了现有商品电子设备上深度学习推断速度,在某些设备上,内存使用量可以降低到 3.29 倍,推断速度可以提高到 3.01 倍,并提出了一种混合专家模型的变化来增加图像分类中的推断速度。