BriefGPT.xyz
大模型
Ask
alpha
关键词
low-rank adaption
搜索结果 - 4
基于变形器的学习可证明具有低秩和稀疏性:一层分析
这篇论文首次从理论上分析了低秩和稀疏性在一层 Transformer 中的特性,并通过数量化可训练参数的梯度更新得出了梯度具有低秩性的结论,同时论文还分析了模型剪枝对泛化能力的影响以及对计算效率的改善。
PDF
6 days ago
ICML
解码低秩适配器中的全球协同效应
我们介绍了 HeteroLoRA,这是一种轻量级的搜索算法,通过利用零成本代理在模型中分配有限的 LoRA 可训练参数,以提高微调性能,并在更具挑战性的搜索空间中展示了 HeteroLoRA 的有效性。
PDF
9 days ago
CVPR
PC-LoRA:基于知识蒸馏的逐步模型压缩的低秩适应
逐步压缩低秩适应(PC-LoRA)方法通过低秩适应同时进行模型压缩和微调,最终仅保留低秩适配器以取代预训练权重,实现了参数和计算量的压缩。
PDF
17 days ago
多模态指令调节与条件化 LoRA 混合
通过与多模态指令调优相结合,引入了一种综合了条件的低秩适应矩阵 (MixLoRA) 的新方法,旨在减轻任务干扰,实现在多样的多模态任务中具有良好的适应性和灵活性。实验结果表明,MixLoRA 不仅在相同或更高秩的情况下胜过传统的低秩适应方法
→
PDF
4 months ago
Prev
Next