ICLRJan, 2024

SliceGPT:通过删除行和列来压缩大型语言模型

TL;DRSliceGPT 是一种新的后训练稀疏化方法,可以将模型的参数减少 25%,同时保持密集模型的 99%,99%和 90%的性能,并减少内存和计算需求。