Jan, 2018

MAttNet: 模块化注意力网络用于指代表达理解

TL;DR本文提出了一种通过使用模块化组件和多种注意力机制,实现对自然语言描述的图像区域定位的方法,该方法在特征抽象、指向性和篮球场景等任务中都优于以往最先进的模型。