Jun, 2024

大规模双层优化的内存高效梯度展开

TL;DR本文介绍了 $(ext {FG})^2 ext {U}$,一种解决大规模双层优化问题的新方法,该方法通过无偏随机近似元梯度来提供更准确的梯度估计,并且支持并行计算以提高计算效率。$(ext {FG})^2 ext {U}$ 在不同阶段的训练过程中可以更加经济高效地应用,且易于在流行的深度学习框架中实现,可适应更具挑战性的零阶双层优化场景。经过全面的理论分析和实证评价,并展示了在多样的大规模双层优化任务中其卓越的性能。