棒球视频中的细粒度活动识别

CVPRApr, 2018

Fine-grained Activity Recognition in Baseball Videos

AJ Piergiovanni, Michael S. Ryoo

TL;DR本文介绍了一个新的细粒度活动检测数据集 MLB-YouTube，研究了利用分类和连续视频中各种识别方法捕捉活动视频中的时间结构，并比较了在难以预测棒球视频中的球速和类型的任务中的模型。发现学习时间结构对于细粒度活动识别非常有价值。

Abstract

In this paper, we introduce a challenging new dataset, MLB-YouTube, designed for fine-grained activity detection. The dataset contains two

发现论文，激发创造

本研究使用轨迹和视觉数据来检测足球比赛中的群体活动，并提出了自我注意力模型来显式地建模球员与球之间的交互作用。结果表明，基于视觉或轨迹的方法都能够在 0.5 秒内识别出大部分事件，并且每种方法都有其独特的挑战。

Apr, 2020

本文针对视频序列中的团体活动行为分类问题，基于 LSTM 模型构建了一个 2 阶段的深度时间模型，同时考虑了个体和群体层面的动态信息，通过在排球视频数据集上的实验验证了该模型的有效性。

Jul, 2016

本研究提出了一种基于 Fisher 向量和时间模型相结合的端到端生成式方法来实现人类活动的分割和识别，其适用于各种视频数据集并且优于现有的最先进方法。

Sep, 2015

本研究提出了一种新的基于 Transformer 模型的团队活动识别方法，该方法借助注意机制对部分环节进行定位与编码，再对其进行聚合以反映整个活动的完整背景和每个环节的时间演化，无需借助较强的监督方法，在两个基准测试中均表现良好。

Apr, 2022

本文介绍了一种新的无监督视频分割方法，采用迭代鉴别生成方法，通过学习视频视觉特征并建模时序结构，将复杂活动划分为多个子活动，并引入背景模型，验证结果优于现有无监督及弱监督方法。

Mar, 2018

本文提出了一种通用的框架，利用新颖的提案方案和级联分类管道从未修剪的视频中准确检测各种活动，超越了现有最先进方法在 THUMOS14 和 ActivityNet 数据集上的表现。

Mar, 2017

本文研究利用深度学习，以图像流中的高级特征为基础识别佩戴式摄像机的运动，并弥补设备低帧率带来的连续帧之间的差异罅隙，从而提升了辅助技术应用中的活动识别效能。

Aug, 2017

本研究旨在探讨如何利用卷积神经网络基于视频数据实现对 MLB 投手的受伤检测和预测，并实验评价该模型在不同投手、不同受伤类型、以及受伤预测时间等方面的性能表现。

Apr, 2019

本研究开发了一种低参数、模块化系统，具有快速推理能力，在有限数据集上完全可以进行训练，无需从大参数系统进行迁移学习。该系统能够准确检测并关联实际课堂视频中执行这些活动的学生，并开发了一个基于交互式 Web 应用程序来可视化长时间真实课堂视频中的人类活动地图。

Mar, 2024

本文提出了一种新的方法学框架 ——DeepSegmenter，该框架同时在单个框架中执行活动分割和分类，以识别驾驶员的异常驾驶行为，并在 2023 年 AI 城市挑战赛的实验验证数据中取得了 0.5426 的活动重叠得分，证明了该系统的有效性、高效性和稳健性。

Apr, 2023