AAAIJun, 2017

用于任务导向的语言基础建模的门控注意力架构

TL;DR提出一种基于端到端可训练神经网络架构,用于在 3D 环境中执行自然语言指令的任务导向语言接地问题,并使用带门控的注意力机制来组合图像和文本表示,并学习执行任务的策略。在一个新的基于 3D 游戏引擎的环境中展示了该模型在未见过的指令和环境下的有效性。