Jan, 2021

几何熵探索

TL;DR本文介绍了通过Geometric Entropy Maximisation(GEM)算法,实现在离散和连续领域中最大化状态访问的Shannon熵的几何感知,以解决复杂的强化学习问题。该算法的优势在于可以很好地解决具有稀疏奖励的强化学习问题,并被证实比其他深度强化学习探索方法更有效。