ICMLFeb, 2019

强化学习的动作表示学习

TL;DR研究了在没有给定先验结构的情况下,如何基于状态表示和行为表示实现模型无关的强化学习方法,并提供了相应的算法和收敛条件。