CVPRApr, 2023

通过生成未来视角图像语义来提升视觉 - 语言导航能力

TL;DR该研究旨在探讨智能体是否可以在导航的同时生成未来视图的语义,并通过三个代理任务和一项辅助损失来教授模型实现该目的;实验表明这种能力使智能体的性能得到了提升,并且学习如何预测未来视图语义使智能体对于长路径的表现更好。