Jul, 2019
具身视觉与语言导航中的动态卷积滤波器
Embodied Vision-and-Language Navigation with Dynamic Convolutional Filters
Federico Landi, Lorenzo Baraldi, Massimiliano Corsini, Rita Cucchiara
TL;DR研究了在 Vision-and-Language Navigation 中,通过利用动态卷积滤波器对视觉信息和语言描述进行编码的方式,设计了一个新的策略,旨在解码为一系列低级的动作序列,与以前的方法相比,该策略在低级别行动空间中表现更佳,并尝试对近期的 VLN 工作进行了分类。