Feb, 2024

提高超梯度估计:预条件和参数重参数化的研究

TL;DR双层优化是一种针对依赖于内部优化问题解的外部目标函数进行优化的方法,在机器学习中广泛应用于超参数调整。本研究通过研究隐藏变量方法的误差,分析了两种减小误差的策略:预处理隐藏变量公式和重新参数化内部问题。我们详细说明了这两种修改对误差的影响,并强调了涉及的功能的高阶导数所起的作用。我们的理论发现解释了何时可以实现超级效率,即使得超梯度的误差与内部问题的误差二次相关,并在这种情况下比较了两种方法。对回归问题的超参数调整的数值评估验证了我们的理论发现。