CVPRFeb, 2019

MUREL:多模态关系推理用于视觉问答

TL;DR本文提出了 MuRel 网络,通过引入 MuRel cell 作为原子性推理原语、模拟问题与图像区域的交互以及建模区域之间的关系,从而利用多模态的关注网络实现复杂的图像识别和多样化的问答。实验表明,MuRel 网络优于现有方法,并在多个数据集上达到了竞争和最优水平。