Jan, 2019

Go-Explore:一种解决困难探索问题的新方法

TL;DR采用记忆、回归与模拟学习等技术结合的算法 Go-Explore 在复杂探索问题上有了显著提高,打破了 Montezuma's Revenge 甚至超越了 Pitfall 的人类高分纪录,为强化学习领域提供了新思路。