BriefGPT.xyz
Ask
alpha
关键词
episodic backward update
搜索结果 - 1
通过分集反向更新实现高样本效率的深度强化学习
本文提出了具有直接价值传播能力的一种新型深度强化学习算法 ——Episodic Backward Update (EBU)。与传统方法通过经验重放的方式使用均匀随机采样不同,我们的算法通过采样整个回合并将状态值连续传递到前一状态。我们的递归
→
PDF
6 years ago
Prev
Next