ICMLJun, 2024

协处理器演员评论家:一种面向模型的自适应脑刺激的强化学习方法

TL;DR通过模型,我们提出了一种新颖的基于模型的强化学习方法,即 Coprocessor 角色扮演者批评家,用于学习神经协处理器策略以进行脑刺激,克服了传统的无模型强化学习方法在样本效率和任务成功方面的局限性,并在一个神经学现实模型中胜过基线的基于模型的强化学习方法。