Oct, 2016

低精度和稀疏性加速深度卷积网络

TL;DR本研究旨在通过采用极低精度(2位)权重网络,并在零值上进行操作跳过以提高计算效率和性能,以在低精度网络下获得更高精度。实验结果表明,与全精度网络相比,在并非影响相似准确度的情况下,计算需求降低了约3倍,且在Imagenet物体分类挑战上取得了最高报道准确度。为了充分利用低精度网络优势,研究小组开发了一种深度学习加速器核心dLAC,可实现每平方毫米单精度浮点运算的TFLOP当量,半精度时可达到每平方毫米的2个TFLOP。