Jan, 2024
紧凑 AI:使用量子启发的张量网络对大型语言模型进行极致压缩
CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks
Andrei Tomut, Saeed S. Jahromi, Sukhbinder Singh, Faysal Ishtiaq, Cesar Muñoz...
TL;DR该研究介绍了一种创新的 LLM 压缩方法,使用量子启发的张量网络来压缩模型的相关空间,实现对 LLaMA-2 7B 模型的压缩,使其仅保留原始大小的 30%,并在经过简要分布式重新训练后恢复原始准确率的 90% 以上。