ICCVOct, 2019

任务导向接地的动态注意力网络

TL;DR本文提出了一种新的动态注意力网络架构,用于文本和视觉表示的高效多模态融合,从而实现自然语言指令下机器人对环境的理解和控制,模型通过 LSTM 实现动态关注,基于任务的接地和增强学习控制中取得了良好效果。