BriefGPT.xyz
Ask
alpha
关键词
action-value estimation
搜索结果 - 1
ICLR
在动作顶点上学习表示动作价值的超图
通过结合 hypergraph networks framework 和 deep Q-networks 方法,有效提升异构空间下 action-value 估计的表现,包括 Atari 2600 游戏和物理控制基准测试等多个领域。
PDF
4 years ago
Prev
Next