Feb, 2020

BitPruning: 学习位长进行激进而精确的量化

TL;DR通过提出一种惩罚体系惩罚大位长表示的正则化方法,我们可以在维持准确性的同时,在任意合适的层次上最小化推理位长。