May, 2023

BiSLS/SPS: 稳定双层优化自动调整步长

TL;DR研究了使用自适应步长方法(随机线性搜索和随机Polyak步长)来计算上下级学习率的BO算法,并发现这些方法可以在不需要精细调节的情况下找到较大的学习率,比起需要精细调节的SGD或Adam BO算法快速收敛。