AAAIFeb, 2021

基于梯度对齐奖励的内循环元学习

TL;DR该研究旨在通过梯度对齐奖励(GAR)引导优化来优化深度学习训练的多个分布,其中应用包括在小规模设置中选择数据分布,以及在 CIFAR-10 和 CIFAR-100 上成功指导学习增强策略等。