AAAIFeb, 2023

行动原子概念学习:解析视觉语言导航

TL;DR本文提出了 Actional Atomic-Concept Learning(AACL),它通过将视觉观测映射到动作原子概念来简化 Vision-Language Navigation 中的观测 - 指令对齐问题。AACL 在细粒度和高级别的 VLN 基准测试中均取得了新的最优结果,并且可视化结果表明 AACL 显着提高了动作决策的可解释性。