BriefGPT.xyz
Ask
alpha
关键词
subgoal selection strategy
搜索结果 - 1
通过潜在地标图在分层强化学习中平衡探索与利用
通过动态构建潜在标志图 (HILL) 学习潜在目标表示,以解决 GCHRL 中的时间连贯性和探索与利用之间的平衡问题,并通过同时考虑节点和边的新颖性和效用度量开发了平衡探索与利用的子目标选择策略。
PDF
a year ago
Prev
Next