Nov, 2015

用于图像问答的叠加注意力网络

TL;DR本文提出了堆叠式注意力网络(SAN),通过自然语言问题分析图像,发现图像问答需要多层推理,于是我们开发了多层 SAN,通过可视化的注意力层,逐层推理以定位答案相关的视觉线索,实验证明 SAN 明显优于先前的最先进方法。