Aug, 2019

关于基于梯度的模型无关元学习算法的收敛理论

TL;DR本文研究了一类基于梯度的元学习方法的收敛性,探讨了它们在非凸损失函数下的最佳可达精度和整体复杂度。我们提出了一种名为 Hessian-Free MAML 的新变体算法,为该算法提供了理论保证,并且解答了这些算法在任务和数据集上学习率和批量大小的选择问题。