CVPRMay, 2017

AVA:时空本地化的原子视觉动作视频数据集

TL;DR介绍一个新的视频数据集 AVA,其中定义了 80 个原子视觉动作并进行了精确的时空注释,可以帮助改进动作识别。提出了一种基于现有方法的新方法,针对 JHMDB 和 UCF101-24 类别的表现更佳,但在 AVA 上仍需开发新的视频理解方法,表明该数据集暴露了动作识别的内在困难。