BriefGPT.xyz
大模型
Ask
alpha
关键词
zeroth-order optimizer
搜索结果 - 2
LLM 模型的无痛二阶微调:基于黑塞矩阵的零阶优化器
使用对角度黑塞矩阵增强零阶优化算法以提高大型语言模型的微调效果,显著减少训练步骤并有效增强模型准确性。
PDF
4 months ago
利用仅前向传递微调语言模型
本篇论文提出了一种名为 MeZO 的零阶优化方法,以替代反向传播法来进行大规模语言模型的微调,从而实现与推理阶段相同的内存占用,该方法在理论上被认为优化大型模型的速度极慢,但本研究的实验结果表明,MeZO 能够使用少至单个 A100 80G
→
PDF
a year ago
Prev
Next