BriefGPT.xyz
Jan, 2023
具有状态抽象的神经元情节控制
Neural Episodic Control with State Abstraction
HTML
PDF
Zhuo Li, Derui Zhu, Yujing Hu, Xiaofei Xie, Lei Ma...
TL;DR
本文提出了一个基于状态抽象的故事式控制算法 NECSA,它采用了更全面的故事记忆、新颖的状态评估以及多步状态分析,对 OpenAI gym 域中的 MuJoCo 和 Atari 任务进行了评估,实验结果表明 NECSA 比最先进的故事式控制方法具有更高的样本效率。
Abstract
Existing
deep reinforcement learning
(DRL) algorithms suffer from sample inefficiency. Generally,
episodic control
-based approaches are solutions that leverage highly-rewarded past experiences to improve
→