滑冰之诗讲习班与挑战：方法与结果

May, 2024

滑冰之诗讲习班与挑战：方法与结果

The SkatingVerse Workshop & Challenge: Methods and Results

Jian Zhao, Lei Jin, Jianshu Li, Zheng Zhu, Yinglei Teng...

TL;DRSkatingVerse 工作坊和挑战旨在鼓励开展研究，致力于开发新颖而准确的方法来理解人类行为。介绍了 SkatingVerse 数据集、训练子集和测试子集，并提供了该挑战的前三种方法的简要概述。

Abstract

The skatingverse workshop & challenge aims to encourage research in developing novel and accurate methods for human action understanding. The ska

skatingverse workshop & challenge human action understanding skatingverse dataset training subset testing subset

发现论文，激发创造

第一届滑冰领域挑战赛冠军解决方案

本研究提供了在第一届 SkatingVerse Challenge 中的获胜解决方案，通过使用 DINO 框架提取兴趣区域（ROI）和精确裁剪原始视频素材，然后采用 Unmasked Teacher、UniformerV2 和 InfoGCN 三个不同的模型捕捉数据的不同方面，最终通过基于 logits 的预测结果集成获得了令人印象深刻的 95.73% 的排行榜分数。

Apr, 2024

FSD-10: 竞技体育内容分析数据集

我们介绍了一个针对竞技体育视频特定的运动动作识别数据集 (FSD-10)，并在其中使用了一种关键帧 (KTSN) 分割网络方法。实验结果表明，这个数据集是衡量运动动作识别算法性能的理想基准，可以促进更健壮、先进的行动识别模型的发展。

Feb, 2020

Kinetics-700-2020 人类动作数据集短注

描述了 DeepMind Kinetics 人类动作数据集的 2020 版本，扩展并更新了 Kinetics-700 数据集，其中包含来自不同 YouTube 视频的至少 700 个视频剪辑，以及介绍了更新的数据集所做的变化和使用 I3D 网络的基线结果的详细统计。

Oct, 2020

运动动作视频动力学人类数据集

介绍了 DeepMind Kinetics 人类动作视频数据集，包含 400 个动作类别的视频片段，视频时长为 10 秒，并描述该数据集的统计信息、收集方式，以及神经网络在分类和偏差分析方面的性能指标和结果。

May, 2017

细粒度动作分析：一个多模态和多任务的花样滑冰数据集

提出了一个多模态和多任务的花样滑冰数据集（MMFS），其中包含了动作识别和动作质量评估，收集了来自世界花样滑冰锦标赛的 11671 个视频片段，包含 256 个类别，包括空间和时间标签。

Jul, 2023

Kinetics-700 人类动作数据集简明注释

本文介绍了 DeepMind Kinetics 人类行为数据集从 600 类扩展到 700 类的详细更改，并使用 I3D 神经网络架构提供了基线结果和全面的统计数据。

Jul, 2019

AVA-Kinetics 本地化人类行为视频数据集

该论文介绍了 AVA-Kinetics 本地化人类行为视频数据集，其中包含超过 230k 个帧，对每个人的关键帧进行了 80 个 AVA 动作类的注释，通过视频行动变换网络在 AVA-Kinetics 数据集上进行了基线评估，并证明了在 AVA 测试集上行动分类的表现有所改善。

May, 2020

达标游戏

该研究提出了一个基于虚拟世界的视觉感知基准测试套件，通过对超过 250,000 个高分辨率视频帧的低层次和高层次的视觉任务进行全面地注释，并针对多个任务分析了最先进方法的表现，提供参考基线和突出未来研究的挑战。

Sep, 2017

体育视频动作识别调查：数据集、方法和应用

本文综述了针对运动分析的视频动作识别方法，介绍了超过十种不同的运动类型，包括个人运动和团队运动。对现有的分析框架进行比较并总结了团队运动和个人运动领域的最新视频动作识别技术。同时，讨论了该领域的挑战和未解决的问题，并开发了一个工具箱，基于 PaddlePaddle 平台，实现了对足球、篮球、乒乓球和花样滑冰的动作识别。

Jun, 2022

Kinetics-600 简要介绍

本文介绍了 DeepMind Kinetics 人类行为数据集的扩展，从拥有 400 个类别和至少 400 个视频片段变成 600 个类别和至少 600 个视频片段，并使用多种语言（葡萄牙语）进行多次查询以拓展数据集，同时使用 I3D 神经网络架构实现了基线性能，论文配合发布了公共测试集的真实标签。

Aug, 2018