BriefGPT.xyz
Ask
alpha
关键词
post-exploration
搜索结果 - 2
先 Go,后 Post-Exploration:后探索在内在动机中的益处
该论文研究了强化学习领域中的一种新方法 “Go-Explore”,通过后探索 (post-exploration) 的方式探明未知状态,通过试验在 MiniGrid 和 Mujoco 环境下得出结论,该方法具有通用性,易于实现,RL 研究人
→
PDF
2 years ago
何时出发,何时探索:后探索对内在动机的益处
本文对 Go-Explore 论文中未解决的问题进行了系统研究,通过对一系列 MiniGrid 环境的实验发现,采用后探索策略能够显著提高强化学习的性能,并利用新的自适应方法进一步提高了效果,证明了自适应后探索是强化学习探索研究的一个有前途
→
PDF
2 years ago
Prev
Next