May, 2016

基于概念和属性的动作分类

TL;DR本研究使用自然语言处理技术检测图像中突出的概念,从而代替直接使用视觉特征来推断目标标签,并在 HICO 数据集和 Stanford-40 Actions 数据集上验证,精确度分别达到了 31.54% 和 83.12%,同时为每个类别提供了语义上有意义的关键词列表和相关图像区域。