Apr, 2023

ES-Single 中展开计算图的低方差梯度估计

TL;DR提出了一种基于进化策略的算法 ES-Single 用于计算未展开的计算图中的梯度,其通过对元损失表面的平滑化克服了递归函数应用中出现的混沌,与最近提出的持久进化策略(PES)类似,ES-Single 是无偏的;相比 PES,ES-Single 更容易实现并且方差较低,而且其方差始终是常数,从而消除了将 ES 应用于长内部问题的关键障碍。实验表明 ES-Single 在各种任务上(包括合成基准、超参数优化、训练递归神经网络以及训练学习优化器)始终优于 PES。