CVPRApr, 2016

通过学习图像描述实现深度结构场景解析

TL;DR本文提出了一种基于深度架构的场景理解方法,通过一个卷积神经网络和一个递归神经网络分别提取图像特征和分层物体结构,结合基于描述性语句的弱监督训练,实现场景图像的自动解析,该方法在 PASCAL VOC 2012 数据集上表现出色。