BriefGPT.xyz
大模型
Ask
alpha
关键词
gradient-based parameter selection
搜索结果 - 1
基于梯度的参数选择以实现高效微调
利用渐变参数选择技术(GPS)来进行参数有效的微调,以提高预训练模型的性能,并证明与全模型微调方法相比,只调整预训练模型中的少数参数并保持其余参数冻结可以实现类似或更好的性能,同时不引入额外的参数和计算成本,并在多个任务中表现出更好的性能。
PDF
7 months ago
Prev
Next