Mar, 2022

强化学习中利用Rényi状态熵加速探索

TL;DR为解决深度强化学习中的长期探索能力问题,本文提出了一种基于Rényi熵的新型内在奖励模块,并通过较广泛的模拟结果证明了其高于现有方案的性能。