Feb, 2024

LLM 模型的无痛二阶微调:基于黑塞矩阵的零阶优化器

TL;DR使用对角度黑塞矩阵增强零阶优化算法以提高大型语言模型的微调效果,显著减少训练步骤并有效增强模型准确性。