BriefGPT.xyz
Ask
alpha
关键词
distance-to-goal
搜索结果 - 2
保持距离:通过自平衡的成形奖励解决稀疏奖励任务
该研究介绍了一种基于辅助距离奖励的、简单且有效的无模型方法,使得机器学习智能体可以有效地解决用简单距离奖励难以解决的稀疏奖励任务,同时不需要额外的奖励工程或领域专业知识。
PDF
5 years ago
自监督学习距离函数用于目标条件强化学习
本文在使用子目标分解强化学习问题时,提出学习适当距离的方法以确定目标是否已实现,并就三种不同情境提出了解决方案,同时还提出了一个目标生成机制。
PDF
5 years ago
Prev
Next