Sep, 2024

两种稀疏矩阵优于一种:通过双重稀疏分解来稀疏化神经网络

TL;DR本文提出了一种新的双重稀疏分解方法,以解决神经网络模型体积大和复杂性高的问题。通过对权重矩阵进行稀疏化,该方法能在保持性能优于稠密模型的同时,大幅降低模型规模(例如,LLaMA2-13B模型可减少50%)。