BriefGPT.xyz
Ask
alpha
关键词
subgoal representation
搜索结果 - 1
概率子目标表示的分层强化学习
高层策略给出低层策略达到的子目标,在这篇论文中,我们提出了一种基于高斯过程的概率子目标表示方法,通过可学习的核函数利用状态空间的长程相关性来学习先验规划步骤中的长程子目标信息,从而适应不确定性。同时,我们还提出了一种新的学习目标,以实现概率
→
PDF
12 days ago
Prev
Next