BriefGPT.xyz
Jul, 2019
基于梯度元学习的泛化理解探索
Towards Understanding Generalization in Gradient-Based Meta-Learning
HTML
PDF
Simon Guiroy, Vikas Verma, Christopher Pal
TL;DR
本文研究了神经网络在基于梯度的元学习中的泛化问题,分析了目标景观的各种特性,提出了一种新的正则化方法以增强模型的泛化能力。实验表明,在元训练提供的元解决方案的基础上,通过几步基于梯度的微调适应元训练模型到新任务时,所得到的元测试解决方案变得越来越平坦,损失更低,并且远离元训练解决方案。
Abstract
In this work we study
generalization
of
neural networks
in
gradient-based
→