Mar, 2023

基于变形金刚 (Block-wise) 的模型比特压缩

TL;DR该研究提出了一种名为 BBCT 的方法,用于对 Transformer-based models 进行块状位压缩,以减少其对计算的需求和内存的占用。经过在 BERT 上的测试,BBCT 可以在保持精度的前提下显著减少模型的计算和内存占用。