Mar, 2018
先斩后奏:桥接基于模型和基于模型的无模型强化学习,为规划先进的视觉语言导航
Look Before You Leap: Bridging Model-Free and Model-Based Reinforcement
Learning for Planned-Ahead Vision-and-Language Navigation
TL;DR本文提出了一种新颖的,提前计划的混合增强学习模型,将模型无关的和模型基于的强化学习相结合,以解决实际的视觉语言导航任务,并且实验结果表明,该方法在真实数据集上表现最佳,还具有更好的可扩展性。