Jul, 2019

随机潜在演员 - 评论家:具有潜在变量模型的深度强化学习

TL;DR本文介绍了一种基于深度强化学习的算法,通过学习潜在表示来加速图像的强化学习,提出了随机潜在 Actor-Critic(SLAC)算法,并表明其在图像控制任务上的表现优于其他无模型或基于模型的替代方案。