行动识别的未来何去何从？一种新模型及动力学数据集

May, 2017

行动识别的未来何去何从？一种新模型及动力学数据集

Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

Joao Carreira, Andrew Zisserman

TL;DR本研究基于 Kinetics 数据集重新评估最先进的体系结构，并引入一种新的双流膨胀 3D ConvNet（I3D），该 ConvNet 可以在视频中学习无缝的时空特征提取器，利用成功的 ImageNet 架构设计及其参数，经过在 Kinetics 上的预训练后，I3D 模型在动作分类方面表现明显提高。

Abstract

The paucity of videos in current action classification datasets (UCF-101 and HMDB-51) has made it difficult to identify good video architectures, as most methods obtain similar performance on existing small-scale benchmarks. This paper re-evaluates state-of-the-art architectures in lig

action classification video architecture kinetics dataset i3d pre-training

发现论文，激发创造

Kinetics-700-2020 人类动作数据集短注

描述了 DeepMind Kinetics 人类动作数据集的 2020 版本，扩展并更新了 Kinetics-700 数据集，其中包含来自不同 YouTube 视频的至少 700 个视频剪辑，以及介绍了更新的数据集所做的变化和使用 I3D 网络的基线结果的详细统计。

Oct, 2020

运动动作视频动力学人类数据集

介绍了 DeepMind Kinetics 人类动作视频数据集，包含 400 个动作类别的视频片段，视频时长为 10 秒，并描述该数据集的统计信息、收集方式，以及神经网络在分类和偏差分析方面的性能指标和结果。

May, 2017

Kinetics-700 人类动作数据集简明注释

本文介绍了 DeepMind Kinetics 人类行为数据集从 600 类扩展到 700 类的详细更改，并使用 I3D 神经网络架构提供了基线结果和全面的统计数据。

Jul, 2019

三流网络用于增强动作识别

该论文提出了两种基于 CNN 的体系结构，包括三种流，可以分别捕捉不同速率的空间和时间信息，并使用双向 LSTM 和注意力机制进一步提高模型性能，实现了人类动作识别任务的最先进表现。

Apr, 2021

骨架动作识别，未来何去何从？

本文研究骨架为基础的人体动作识别的当前和未来发展方向，以 Skeletics-152、Skeleton-Mimetics、Metaphorics 和 NTU-120 等数据集作为研究对象，旨在评估现有方法和数据集的优劣，并开辟人体动作识别的新领域。

Jul, 2020

Kinetics-600 简要介绍

本文介绍了 DeepMind Kinetics 人类行为数据集的扩展，从拥有 400 个类别和至少 400 个视频片段变成 600 个类别和至少 600 个视频片段，并使用多种语言（葡萄牙语）进行多次查询以拓展数据集，同时使用 I3D 神经网络架构实现了基线性能，论文配合发布了公共测试集的真实标签。

Aug, 2018

AVA-Kinetics 本地化人类行为视频数据集

该论文介绍了 AVA-Kinetics 本地化人类行为视频数据集，其中包含超过 230k 个帧，对每个人的关键帧进行了 80 个 AVA 动作类的注释，通过视频行动变换网络在 AVA-Kinetics 数据集上进行了基线评估，并证明了在 AVA 测试集上行动分类的表现有所改善。

May, 2020

动作检测的结构化模型

本篇论文提出了一种增强标准 I3D 网络的算法，通过添加跟踪模块和图卷积网络结构，将领域知识融入模型，并在活动行为检测中获得了更好的结果表现。

Dec, 2018

人体动作识别的多视点室外数据集

该论文提供了一个从多个角度观测人类行为的数据集，并在两流卷积神经网络结构配合核排名汇总的方法下获得了 74.0% 的动作识别准确率。

Oct, 2021

动作识别：从静态数据集到移动机器人

通过利用 “提议（proposals）” 方法生成行为区域的模型训练，能够在无约束视频中实现人的行为识别，无论是否存在摄像头运动；该方法在两个新的数据集中取得了超越最先进技术的性能，同时在异常行为检测场景中取得较高的成功率。

Jan, 2017