ICLRJun, 2021

SHINE:双层优化和隐式模型的前向传递反向估计共享

TL;DR本论文提出了一种新的策略来解决双重问题在计算上的瓶颈,该方法通过使用前向传递中的拟牛顿矩阵来有效地近似计算需要梯度的反向传递中的逆雅各比矩阵,从而降低了计算成本。该方法在超参数优化问题上具有显著优势,并且在规模更大的问题上与 Jacobian-free 方法一样具有可比性能。