Sep, 2019

可达结果空间的无监督学习和探索

TL;DR本文介绍了一种新的基于种群分布式搜索的无任务探索算法 TAXONS,可用于直接从高维观测数据中寻找有效策略,结合重构误差在极少先验知识的情况下自适应驱动搜索,能够在稀疏奖励问题中成功探索出多样化的控制器。