Jul, 2023

回溯优化器:k 步回溯,1 步前进

TL;DR通过结合Lookahead优化器和锐度感知最小化技术,使用Lookbehind方法对深度神经网络进行训练,实现更好的稳定性和损失锐度的权衡,以提高泛化性能、鲁棒性和遗忘容忍度。