NIPSDec, 2017

移动设备上高性能超低精度卷积

TL;DR通过对 ARMv7 设备上现代深度学习工作负载所需的核心基本操作进行开源实现和全面分析,我们展示了与现有市场上的 float32 和 int8 基准相比,使用大于 4 位精度的最先进的超低精度技术可获得 4 倍至 20 倍的加速度。