Jun, 2015

在图像中描述常见的人类视觉动作

TL;DR在MS COCO数据集的图像中,探索了可检测到的动作和交互,包括140种常见的视觉动作和其完整的主体-客体标注集(COCO-a),该集合相较于现有的动作数据集具有更多的动作数量和实例,并具有更为全面、无偏、独特的定位特征。