Mar, 2018

基于无监督学习的目标领域非赏值驱动探索

TL;DR本研究提出使用深度表示学习算法学习目标空间的方法,通过此方法可以发现探索算法,与工程化表示法相比性能表现相匹配。