在线动作检测

Apr, 2016

Online Action Detection

Roeland De Geest, Efstratios Gavves, Amir Ghodrati, Zhenyang Li, Cees Snoek...

TL;DR该研究针对在线动作检测问题，提出了一个基于现实数据的真实数据集，并通过分析多种基准方法以及评价协议，展示该问题具有挑战性，为后续在线动作检测研究提供了数据和模型。

Abstract

In online action detection, the goal is to detect the start of an action in a video stream as soon as it happens. For instance, if a child is chasing a ball, an autonomous car should recognize what is going on and respond immediately. This is a very challenging problem for four reasons

online action detection realistic dataset baseline methods evaluation protocol real-world data

发现论文，激发创造

在线检测未剪辑流视频中的动作开始

该论文探讨了在线检测未修剪视频中动作开始的新颖任务 - 在线开始检测（ODAS）的技术，提出了三种方法来解决 ODAS 模型训练中存在的挑战，包括利用生成对抗网络（GAN）产生艰难的负样本、显式建模动作开始周围数据和后续数据之间的时态一致性以及自适应抽样策略来处理训练数据的稀缺性，进而在 THUMOS'14 和 ActivityNet 上进行广泛实验，证明了提出的方法的显著性能提升和改善先前最先进方法的有效性。

Feb, 2018

深度视频动作识别的全面研究

本文综述了 200 多篇关于视频动作识别的深度学习论文，介绍了 17 个影响模型设计的数据集和深度学习模型的发展历程，包括深度学习适应、双流网络、3D 卷积核和计算效率模型，并对几种方法在典型数据集上进行了基准测试，最后，讨论了视频动作识别面临的问题和未来的研究机会。

Dec, 2020

视频动作检测：分析限制和挑战

本文旨在探讨在视频动作检测中，除数据集规模外其他能够衡量数据集质量的属性，并且提出了一个新的，适用于真实世界应用的多演员多行为（MAMA）数据集，同时还对影响视频数据集的时间关系进行了相关性研究，进而发现现有方法存在偏见。

Apr, 2022

StartNet：不裁剪视频中的行为开始在线检测

StartNet 是一种面向在线检测行动开始（ODAS）的解决方案，其中使用 ClsNet 进行动作分类并使用 LocNet 进行开始点定位，评估表明其在 THUMOS'14 上的性能比现有技术提高了 15％-30％p-mAP，在 ActivityNet 上的性能与 10 倍较小的时间偏移相当。

Mar, 2019

从网络监督视频数据中学习细粒度动作概念的 YouTube 数据集挖掘

介绍了一个大规模的现实世界数据集，该数据集用于评估人类行为识别的学习技术，进一步提出了在无人干预状态下收集数据和训练的方法，并针对该训练数据出现的语义不一致性问题，提出了一个语义分层结构。

Jun, 2019

在线动作检测的时序循环网络

本文提出了一种新颖的框架 Temporal Recurrent Network (TRN) 来模拟视频帧的时间上下文，在线执行行动检测并预测即将发生的行动，实现了累积历史证据和预测未来信息相结合的在线识别方式，并在 HDD、TVSeries 和 THUMOS'14 三个数据集上进行评估，表明 TRN 的性能显著优于现有技术。

Nov, 2018

早期动作识别与动作原型

利用部分观察到的视频和原型表示，我们提出了一种早期行为识别模型，通过训练视频的短片段来预测行为并在多个实际数据集上取得了显著的改进。

Dec, 2023

JOADAA：联合在线动作检测和动作预测

通过结合动作预测和在线动作检测，我们提出了一种统一的模型 JOADAA，能够覆盖在线动作检测中未来信息的缺失依赖关系，并在 THUMOS'14、CHARADES 和 Multi-THUMOS 三个具有挑战性的数据集上取得了最优结果。

Sep, 2023

O-TALC: 应对在线动作分割中过度细分的步骤

在线临时动作分割通过改进的训练和推理方法提高了骨干动作识别模型的训练和在线帧级分类性能，可用于实时 HRI 任务，尤其在处理细粒度数据集时表现出色。

Apr, 2024

联合分类回归循环神经网络实现在线人体动作检测

本文研究了如何从流媒体骨架数据中实时监测并识别出人类动作，并提出了一种基于神经网络的多任务分类回归模型来更准确地定位动作类型和时间位置信息，该模型具有较高的计算效率和准确性。

Apr, 2016