渐进式关系学习用于群体活动识别
本研究提出一种基于序列关系预测模型的组活动预测方法,该模型可以总结部分观测数据中的关系动态并逐步预测具有区分性信息的群体表示,通过两种图形自编码器预测活动特征和位置,并在实验中取得了显著的预测效果。
Aug, 2020
本文提出了一种基于深度学习和 Actor Relation Graph(ARG)的方法,用于高效地学习和建模多人场景中演员之间的关系,并在两个标准数据集上取得了现有最佳表现
Apr, 2019
本文提出了一种高效的时间推理图 (TRG), 用于同时捕捉视频序列之间的外观特征和时间关系。通过构建可学习的时间关系图来探索多尺度范围上的时间关系。在多头时间邻接矩阵的帮助下,提出了一个多头时间关系聚合器来提取那些通过图卷积计算的特征的语义含义。实验证明,通过我们的 TRG 进行时间关系推理可以提取用于活动识别的判别特征。
Aug, 2019
本文提出了一种将图形模型和深度神经网络集成到一个联合框架中的方法,在序列推断方面采用递归神经网络的建模,通过对节点之间的边缘施加门来学习推断的适当结构。实证研究表明,这种模型具有处理高度结构化学习任务的潜力,再现了在群体活动识别问题的表现。
Nov, 2015
本文提出了一种基于深度神经网络和分层图模型的个人和群体活动监测方案,使用深度网络识别场景中个人的动作,并通过考虑类别间的依赖关系使用神经网络分层图模型完善每个类别的预测标签,该方法能有效改善基准测试方法的识别率。
Jun, 2015
本文提出结构递归神经网络 (SRNN),用于捕捉个体动作、个体间互动、以及整个群体活动。相比于之前的方法,本文使用网格池化层来解决群体中的个体数量变化的问题,同时在排球数据集上评估了两种 SRNN 变体的性能。
Feb, 2018
本文提出一种基于 actor-transformer model 认知视频中的个人行为和组群活动的模型,并通过 2D 姿态网络和 3D CNN 等方式提供丰富的个人动态和静态信息表示,从而在公开数据集上取得了显著的效果。
Mar, 2020
本文针对视频序列中的团体活动行为分类问题,基于 LSTM 模型构建了一个 2 阶段的深度时间模型,同时考虑了个体和群体层面的动态信息,通过在排球视频数据集上的实验验证了该模型的有效性。
Jul, 2016
本文提出了一个称作 Convolutional Relational Machine(CRM)的深度卷积神经网络模型,用于识别图像或视频中的团体活动。该模型利用个体之间的空间关系来产生中间的活动表征,经过多阶段逐步修正,在最后的聚合模块中使用修正后的信息来识别团体活动,并展示了其在 Volleyball 和 Collective Activity 数据集上比现有模型具有的优势。
Apr, 2019
在计算机视觉领域,团体活动识别是一个热门话题。通过对团体关系进行活动识别,在视频分析、监控、自动驾驶和理解社交活动等各种场景中具有实际意义。本文综述了团体活动识别技术的现有研究进展,重点关注全局交互性和活动。首先,全面回顾了相关文献和各种团体活动识别方法,从传统方法到基于空间结构、描述符、非深度学习、分层循环神经网络(HRNN)、关系模型和注意机制的最新方法。其次,针对每个模块提出了关系网络和关系架构。第三,调查了团体活动识别的方法,并将其性能与最先进的技术进行了比较。总结了现有的挑战,并为新手提供了全面的指导,以便理解团体活动识别。此外,还回顾了团体活动识别中的新视角,探索了新的方向和可能性。
Jul, 2023