Feb, 2020

精确门控:通过动态双精度激活提高神经网络效率

TL;DR该研究提出一种高效的深度神经网络量化技术 - 精度门控(PG),可以动态地将大部分特征低精度计算,只将少量重要特征使用高精度计算来保证精度,从而大幅减少计算成本,同时保持准确率。该技术适用于各种DNN体系结构和模型,对于CNNs,PG与ImageNet数据集上的最优量化技术相比,准确率相同或更高,但计算耗费只有2.4倍。同时,PG还可以应用于RNNs,并且相比8位均匀量化,其在Penn Tree Bank数据集上的LSTM上获得了1.2%的困惑度提高和2.7倍的计算成本降低。