Jul, 2024

随机潜在探索的深度强化学习

TL;DR介绍了一种名为随机潜在探索(RLE)的新的探索技术,其结合了基于奖励和基于噪声的探索策略的优点,以有效地探索深度强化学习中的高维状态空间。RLE通过在环境的特定(随机)状态中将结构化的随机奖励添加到原始任务奖励中,鼓励代理在训练过程中探索环境。RLE易于实现且在实践中表现良好。通过在具有挑战性的Atari和IsaacGym基准测试上评估RLE,发现RLE在所有任务中表现出比其他方法更高的综合得分。