Dec, 2023

基于梯度的参数选择以实现高效微调

TL;DR利用渐变参数选择技术(GPS)来进行参数有效的微调,以提高预训练模型的性能,并证明与全模型微调方法相比,只调整预训练模型中的少数参数并保持其余参数冻结可以实现类似或更好的性能,同时不引入额外的参数和计算成本,并在多个任务中表现出更好的性能。