描述了 DeepMind Kinetics 人类动作数据集的 2020 版本,扩展并更新了 Kinetics-700 数据集,其中包含来自不同 YouTube 视频的至少 700 个视频剪辑,以及介绍了更新的数据集所做的变化和使用 I3D 网络的基线结果的详细统计。
Oct, 2020
本文介绍了 DeepMind Kinetics 人类行为数据集的扩展,从拥有 400 个类别和至少 400 个视频片段变成 600 个类别和至少 600 个视频片段,并使用多种语言(葡萄牙语)进行多次查询以拓展数据集,同时使用 I3D 神经网络架构实现了基线性能,论文配合发布了公共测试集的真实标签。
Aug, 2018
介绍了 DeepMind Kinetics 人类动作视频数据集,包含 400 个动作类别的视频片段,视频时长为 10 秒,并描述该数据集的统计信息、收集方式,以及神经网络在分类和偏差分析方面的性能指标和结果。
May, 2017
该论文介绍了 AVA-Kinetics 本地化人类行为视频数据集,其中包含超过 230k 个帧,对每个人的关键帧进行了 80 个 AVA 动作类的注释,通过视频行动变换网络在 AVA-Kinetics 数据集上进行了基线评估,并证明了在 AVA 测试集上行动分类的表现有所改善。
May, 2020
本研究基于 Kinetics 数据集重新评估最先进的体系结构,并引入一种新的双流膨胀 3D ConvNet(I3D),该 ConvNet 可以在视频中学习无缝的时空特征提取器,利用成功的 ImageNet 架构设计及其参数,经过在 Kinetics 上的预训练后,I3D 模型在动作分类方面表现明显提高。
介绍了 UCF101,这是一个包含 101 个动作类别的数据集,超过 13k 个剪辑和 27 小时的视频数据,利用标准词袋法对该数据集进行了基线动作识别结果,总体性能为 44.5%。据我们所知,UCF101 目前是由于其大量的类别,大量的剪辑和无约束的特点为最具挑战性的动作数据集。
Dec, 2012
介绍了一个新的包含人类行为的视频和语言数据集,该数据集专注于描述动态人类动作的故事意图和局限性表达式,该数据集预计对评估包括否定和量化在内的复杂语句与视频之间的多模态推理系统非常有用。
Jun, 2021
本文介绍了一组新的人体运动和视频数据集 MoVi,其中包括 60 名女性和 30 名男性表演 20 种预定义的日常动作和运动,以及一种自选运动。该数据集包含 9 小时的运动捕捉数据、17 小时的 4 个不同视角的视频数据和 6.6 小时的 IMU 数据,同时还描述了数据集的收集和后处理过程,并探讨了该数据集可促进的研究方向。
Mar, 2020
本文介绍新的数据集 HAA500,该数据集包含 500 类人类中心的原子动作,用于动作识别,比现有的数据集更具细微粒度和人类动作。
Sep, 2020
该论文提供了一个从多个角度观测人类行为的数据集,并在两流卷积神经网络结构配合核排名汇总的方法下获得了 74.0% 的动作识别准确率。
Oct, 2021