Feb, 2020

探索、发现与学习:基于无监督方式的状态覆盖技能发现

TL;DR本文提出了一种名为 ' 探索、发现、学习 '(Explore, Discover and Learn, EDL)的方法,用于在没有面向任务的奖励功能的情况下获取技能,从而解决现有信息理论技能探索算法的覆盖问题,并在受控环境中进行全面的评估