May, 2019

COBRA: 通过无监督目标发现和基于好奇心的探索实现数据高效的基于模型的强化学习

TL;DR该研究提出了一种基于 Curious Object-Based seaRch Agent( COBRA)的深度强化学习算法来提高数据效率和鲁棒性,其使用自主探索和无监督学习建立环境和动作空间的基于对象的模型,在极少的步骤中通过基于模型的搜索学习各种任务并在政策稳健性结构化保持测试中表现出色。