Sep, 2023

通过可共同学习的码书和映射压缩网络的内存占用

TL;DR通过量化、码书和联合可学习码书等方法,本文提出了一种有效的深度神经网络近似方法,使得 Llama 7B 网络可以在 5 年前的智能手机上以 2GB 的内存占用进行加载。