ICLRMay, 2021

VTNet: 面向对象导航的视觉 Transformer 网络

TL;DR本文介绍了一种使用视觉转换网络技术的目标导航方法,该方法有效利用场景中各个物体之间的关系和空间位置,以实现方向导航,并通过预训练方案将视觉表示与导航信号进行关联,进一步提高了导航策略的学习效果。实验结果表明,这种方法在 AI2-Thor 等人工环境中的表现优于其他先进的目标导航方法。