ICLRFeb, 2020

DDPNOpt:微分动态规划神经优化器

TL;DR本研究旨在将深度神经网络的训练过程从轨迹优化的角度重新制定,提出了一种基于差分动态规划的优化器,DDP Neural Optimizer(DDPNOpt),其具有层间反馈策略、收敛性高等优点,且在避免梯度消失方面表现出惊人的优越性,展示了基于最优控制理论的算法设计的新思路。