Jul, 2020

SGQuant:使用专用量化技术压缩图神经网络的最后一位

TL;DR本文提出了一种专门针对内存受限设备的 GNN 量化方案 SGQuant,该方案旨在系统地减少 GNN 的内存消耗,通过 GNN 定制的量化算法设计、分层量化策略以及自动位数选择等措施,在减少内存消耗的同时保证模型的高精度,非常有效地将内存占用缩小了 4.25 到 31.9 倍。