Dec, 2022

先Go,后Post-Exploration:后探索在内在动机中的益处

TL;DR该论文研究了强化学习领域中的一种新方法“Go-Explore”,通过后探索(post-exploration)的方式探明未知状态,通过试验在MiniGrid和Mujoco环境下得出结论,该方法具有通用性,易于实现,RL研究人员可考虑在intrinsically motivated goal exploration process中采用post-exploration。