Sep, 2020

基于表征空间的新颖性搜索,用于高效探索

TL;DR通过将环境的低维编码与基于模型和无模型目标相结合的学习相结合,提出了一种有效探索的新方法,利用了基于低维表示空间最近邻之间的距离来衡量新颖性的固有奖励,进而在表示空间中利用这些固有奖励在奖励稀疏的困难探索任务中进行样本高效的探索。