Jun, 2020

AR-DAE: 基于无偏神经熵梯度估计的研究

TL;DR该论文介绍了一种名为AR-DAE的方法,利用其逼近概率密度函数的梯度来估计熵的梯度,并通过该方法在密度估计和连续控制问题中实现了最先进的性能。