ICLRSep, 2018

使用语义模型进行学习和规划

TL;DR本论文提出了一种基于深度强化学习的混合模型与无模型集成的方法 LEAPS,通过对含有内在语义规律但视觉多样性的人造环境的实验表明其比不考虑语义内容的强基线更有效。