ICMLAug, 2018

作为 Wasserstein 梯度流的策略优化

TL;DR通过将策略优化视为概率度量空间中的 Wasserstein 梯度流,我们在数字化求解相应的离散梯度流时开发了高效算法,通过实验证明了此方法的有效性。