Mar, 2022

强化学习中利用 Rényi 状态熵加速探索

TL;DR为解决深度强化学习中的长期探索能力问题,本文提出了一种基于 Rényi 熵的新型内在奖励模块,并通过较广泛的模拟结果证明了其高于现有方案的性能。