Nov, 2019

保持距离:通过自平衡的成形奖励解决稀疏奖励任务

TL;DR该研究介绍了一种基于辅助距离奖励的、简单且有效的无模型方法,使得机器学习智能体可以有效地解决用简单距离奖励难以解决的稀疏奖励任务,同时不需要额外的奖励工程或领域专业知识。