Dec, 2017

HACS: 人类动作片段与片段数据集,用于识别和时间定位

TL;DR本文提出了一个新的大规模视频数据集,用于识别和时间定位从Web视频中收集的人类动作,HACS(Human Action Clips and Segments)。我们利用视觉分类器中的共识和分歧来自动挖掘未标记视频中的候选短片段,并由人类标注员进行验证。HACS Clips包含150万个已标注片段,HACS Segments包含139,000个动作片段,涵盖200个类别。该数据集是大规模动作识别基准和时空特征学习的良好来源。