Sep, 2020

任务、稳定性、架构和计算:训练更有效的学习优化器,并使用它们来训练自己

TL;DR本文讲述了利用神经网络参数化的层次优化器提供自动正则化的能力,从而可以训练多种问题的通用学习优化器,可适应超参数和架构的变化,且适用于自我训练等需要解决分布问题的任务。