CVPRApr, 2019

上下文与属性基础的密集字幕

TL;DR本文提出了一种基于上下文推理和多级属性的视觉挖掘及区域描述生成的密集字幕框架,并利用层次化语义属性提供辅助监督,实验结果表明该模型优于现有最先进的方法。