Oct, 2023

优秀的规则性形成大学习率的隐式偏差:稳定性、平衡和推动力的边界

TL;DR优化中的大学习率、隐性偏差、非凸优化、规则性和收敛理论之间的关系。