BriefGPT.xyz
Ask
alpha
关键词
low-rank initialization
搜索结果 - 2
LoftQ: 针对大型语言模型的 LoRA 微调感知量化
我们提出了 LoftQ,这是一个新的量化框架,旨在同时量化 LLM 并为 LoRA fine-tuning 找到适当的低秩初始化,以改善量化和全精度模型之间的差异,并显著提高下游任务的泛化性能。
PDF
9 months ago
用于低秩神经网络的非线性初始化方法
我们提出了一种新的低秩初始化框架,用于训练低秩深度神经网络,证明了这种方法在 ReLU 网络中的有效性,并使用此方法训练了 ResNet 和 EfficientNet 模型。
PDF
2 years ago
Prev
Next