CVPRFeb, 2019
MUREL:多模态关系推理用于视觉问答
MUREL: Multimodal Relational Reasoning for Visual Question Answering
Remi Cadene, Hedi Ben-younes, Matthieu Cord, Nicolas Thome
TL;DR本文提出了 MuRel 网络,通过引入 MuRel cell 作为原子性推理原语、模拟问题与图像区域的交互以及建模区域之间的关系,从而利用多模态的关注网络实现复杂的图像识别和多样化的问答。实验表明,MuRel 网络优于现有方法,并在多个数据集上达到了竞争和最优水平。