CVPRJan, 2020

弱监督视觉语义解析

TL;DR本文提出了一个广义的场景图生成模型 —— 视觉语义解析,并基于动态、注意力机制的二分图传递框架设计了关注于图节点和边的视觉语义解析网络 (VSPNet),同时通过一种全新的图对齐算法,建立了第一个基于图的弱监督学习框架。大量实验证明 VSPNet 优于弱监督基准,而且速度是基准的数倍,因此是训练时效和性能平衡的一个不错的选择。