CVPRApr, 2022

加强型结构化状态演进的视觉语言导航

TL;DR本文提出了一种新的结构化状态演化(SEvol)模型,采用基于图的特征来表示导航状态,利用增强学习策略通过 Reinforced Layout clues Miner(RLM)挖掘和检测关键的布局图,并通过结构演化模块(SEM)来维护结构化基于图的状态,从而提高了 Vision-and-language Navigation 任务的性能。