Jan, 2023

具有状态抽象的神经元情节控制

TL;DR本文提出了一个基于状态抽象的故事式控制算法 NECSA,它采用了更全面的故事记忆、新颖的状态评估以及多步状态分析,对 OpenAI gym 域中的 MuJoCo 和 Atari 任务进行了评估,实验结果表明 NECSA 比最先进的故事式控制方法具有更高的样本效率。