Jun, 2022
基于Hessian的一般化保证的深度神经网络鲁棒微调
Robust Fine-Tuning of Deep Neural Networks with Hessian-based
Generalization Guarantees
TL;DR本研究着重于探讨fine-tuning方法对目标任务迁移学习的一般化能力以及过拟合的问题, 结论发现Hessian是影响fine-tuning方法一般化能力的重要因素, 并设计了一种具有一般化误差保证的基于Hessian距离的fine-tuning方法, 在实证研究中取得了优于已有方法的精度表现, 方差也更小。