CVPRApr, 2019

因子图注意力

TL;DR本研究提出了基于因子图的注意力机制,结合任意数量的数据工具对视觉对话进行建模,提高视觉对话系统的性能表现。实验结果表明,该方法在当前领先技术上提升了 1.1%和 2%的 MRR 分数,并且在 VisDial1.0 上的集成模型提高了超过 6%的 MRR 分数。