Dec, 2022
先Go,后Post-Exploration:后探索在内在动机中的益处
First Go, then Post-Explore: the Benefits of Post-Exploration in
Intrinsic Motivation
TL;DR该论文研究了强化学习领域中的一种新方法“Go-Explore”,通过后探索(post-exploration)的方式探明未知状态,通过试验在MiniGrid和Mujoco环境下得出结论,该方法具有通用性,易于实现,RL研究人员可考虑在intrinsically motivated goal exploration process中采用post-exploration。