ICLROct, 2020

在动作顶点上学习表示动作价值的超图

TL;DR通过结合 hypergraph networks framework 和 deep Q-networks 方法,有效提升异构空间下 action-value 估计的表现,包括 Atari 2600 游戏和物理控制基准测试等多个领域。