本研究提供了在第一届 SkatingVerse Challenge 中的获胜解决方案,通过使用 DINO 框架提取兴趣区域(ROI)和精确裁剪原始视频素材,然后采用 Unmasked Teacher、UniformerV2 和 InfoGCN 三个不同的模型捕捉数据的不同方面,最终通过基于 logits 的预测结果集成获得了令人印象深刻的 95.73% 的排行榜分数。
Apr, 2024
我们介绍了一个针对竞技体育视频特定的运动动作识别数据集 (FSD-10),并在其中使用了一种关键帧 (KTSN) 分割网络方法。实验结果表明,这个数据集是衡量运动动作识别算法性能的理想基准,可以促进更健壮、先进的行动识别模型的发展。
Feb, 2020
描述了 DeepMind Kinetics 人类动作数据集的 2020 版本,扩展并更新了 Kinetics-700 数据集,其中包含来自不同 YouTube 视频的至少 700 个视频剪辑,以及介绍了更新的数据集所做的变化和使用 I3D 网络的基线结果的详细统计。
Oct, 2020
介绍了 DeepMind Kinetics 人类动作视频数据集,包含 400 个动作类别的视频片段,视频时长为 10 秒,并描述该数据集的统计信息、收集方式,以及神经网络在分类和偏差分析方面的性能指标和结果。
May, 2017
提出了一个多模态和多任务的花样滑冰数据集(MMFS),其中包含了动作识别和动作质量评估,收集了来自世界花样滑冰锦标赛的 11671 个视频片段,包含 256 个类别,包括空间和时间标签。
Jul, 2023
本文介绍了 DeepMind Kinetics 人类行为数据集从 600 类扩展到 700 类的详细更改,并使用 I3D 神经网络架构提供了基线结果和全面的统计数据。
Jul, 2019
该论文介绍了 AVA-Kinetics 本地化人类行为视频数据集,其中包含超过 230k 个帧,对每个人的关键帧进行了 80 个 AVA 动作类的注释,通过视频行动变换网络在 AVA-Kinetics 数据集上进行了基线评估,并证明了在 AVA 测试集上行动分类的表现有所改善。
May, 2020
该研究提出了一个基于虚拟世界的视觉感知基准测试套件,通过对超过 250,000 个高分辨率视频帧的低层次和高层次的视觉任务进行全面地注释,并针对多个任务分析了最先进方法的表现,提供参考基线和突出未来研究的挑战。
Sep, 2017
本文综述了针对运动分析的视频动作识别方法,介绍了超过十种不同的运动类型,包括个人运动和团队运动。对现有的分析框架进行比较并总结了团队运动和个人运动领域的最新视频动作识别技术。同时,讨论了该领域的挑战和未解决的问题,并开发了一个工具箱,基于 PaddlePaddle 平台,实现了对足球、篮球、乒乓球和花样滑冰的动作识别。
Jun, 2022
本文介绍了 DeepMind Kinetics 人类行为数据集的扩展,从拥有 400 个类别和至少 400 个视频片段变成 600 个类别和至少 600 个视频片段,并使用多种语言(葡萄牙语)进行多次查询以拓展数据集,同时使用 I3D 神经网络架构实现了基线性能,论文配合发布了公共测试集的真实标签。
Aug, 2018