ICMLJul, 2021

利用广义图绘制实现更好的拉普拉斯表示在强化学习中

TL;DR该研究探讨了利用 Laplacian 矩阵对状态进行编码的问题,本文提出了一种新的学习方法, 可以为大规模状态空间的强化学习任务提供高质量的 Laplacian 表示,从而产生更好的奖励塑形和探索性选择。