May, 2024

ReALLM:LLM 压缩与微调的通用框架

TL;DR一种新颖的方法 ReALLM 用于对预训练语言模型进行压缩和内存高效自适应,包括大多数的后训练量化和微调方法,用于 4 位以下的预算。