Nov, 2019

嵌入表格的训练后 4 位量化

TL;DR本文研究在推荐系统中使用连续表示的实体进行后训练四位量化,提出了基于行均匀量化和基于码本量化的量化方法,这些方法在减少精度降级方面均优于现有的量化方法,作者在 Facebook 的生产模型中应用了均匀量化技术并表明该技术可以将模型尺寸压缩到单精度版本的只有 13.89% 的大小,而模型质量保持不变。