CVPRFeb, 2022

一步一步:里程碑式的长期视觉语言导航

TL;DR提出了一种基于里程碑的任务追踪模型(M-TRACK),可帮助自主代理并监测其进展,通过在具有大量行动序列和导航里程碑的长时间任务中的应用,相较基础模型获得了 33% 和 52% 的成功率提高。