CVPRMar, 2021

结构化场景记忆用于视觉语言导航

TL;DR提出一种名为结构化场景记忆(SSM)的模型架构,通过具有采集 - 读取控制器的全面行动空间和以前视经验的编码来辅助导航决策,并实现长程推理和全局规划,证明在 R2R 和 R4R 度量标准上实现了最先进的表现。