ICLRJul, 2020

随机自动微分

TL;DR提出了随机自动微分 (RAD) 的一般框架和方法,可实现减少内存的无偏梯度估计,特别适用于小批量的反向传播神经网络,同时适用于科学计算中的优化控制参数