Jun, 2022

基于Hessian的一般化保证的深度神经网络鲁棒微调

TL;DR本研究着重于探讨fine-tuning方法对目标任务迁移学习的一般化能力以及过拟合的问题, 结论发现Hessian是影响fine-tuning方法一般化能力的重要因素, 并设计了一种具有一般化误差保证的基于Hessian距离的fine-tuning方法, 在实证研究中取得了优于已有方法的精度表现, 方差也更小。