BriefGPT.xyz
大模型
Ask
alpha
关键词
flora
搜索结果 - 3
多模式大型语言模型与融合低秩适应用于设备定向语音检测
通过使用 FLoRA 技术,将预训练的单模态大型语言模型适应到新的未见模态上,可以有效地改进多模态语言模型在设备导向的语音检测上的性能,并且通过引入适配器丢弃机制,提高了鲁棒性和模型的可扩展性。
PDF
21 days ago
FLoRA: N 维低秩核空间
本文介绍了针对不同维参数空间的一种广义参数高效微调框架 FLoRA,通过 Tucker 分解在保持与原始空间一致的拓扑结构的低秩核空间上建模变化,并将相关权重用于重构原始空间中的变化,从而有效地保留原始 N 维参数空间变化的结构完整性,同时
→
PDF
a month ago
Flora: 低秩适配器是隐形的梯度压缩器
提出了低秩适应(LoRA)方法,通过训练较少的参数来减少优化状态的存储消耗,但会限制整体权重更新矩阵为低秩,本研究基于观察到低秩适应可以用随机投影来近似,因此提出了 Flora 方法,通过重新采样投影矩阵实现高秩更新,同时享受优化状态的次线
→
PDF
5 months ago
Prev
Next