ICMLJul, 2017

DARLA: 在强化学习中改进零样本迁移

TL;DR该论文讨论利用多级深度强化学习代理 DARLA,通过学习离散化的环境表示,使策略更具鲁棒性实现领域自适应,该方法在不同的 RL 环境(Jaco arm, DeepMind Lab)和基本 RL 算法(DQN, A3C, and EC)中显示出比传统基线方法更好的性能表现。