Feb, 2018

DiCE: 无限可微分蒙特卡洛估计器

TL;DR本文介绍了DiCE,一种在随机计算图中生成任意阶导数的正确估计量的单一目标函数,相比使用固定的样本进行逼近的Surrogate Loss方法,DiCE使用自动微分进行图形操作,能更好地解决上述问题,同时提出了DiCE在多智能体学习中的应用。