CVPRMar, 2023

Meta-Explore:使用场景对象频谱基础的探索性分层视觉语言导航

TL;DR提出了 Meta-Explore 方法,该方法使用一种基于 2D 傅立叶变换的新型视觉表示方法 - 场景对象谱,结合了一种利用未探索状态的利用策略,以及带有语义信息的后悔探索方法,从而可以更好地解决 VLN 中跟随自然语言指令进行导航的问题,并在三个 VLN 基准测试中,Meta-Explore 相对于其他基线模型表现出更好的性能。