Jan, 2024

紧凑 AI:使用量子启发的张量网络对大型语言模型进行极致压缩

TL;DR该研究介绍了一种创新的 LLM 压缩方法,使用量子启发的张量网络来压缩模型的相关空间,实现对 LLaMA-2 7B 模型的压缩,使其仅保留原始大小的 30%,并在经过简要分布式重新训练后恢复原始准确率的 90% 以上。