群体活动识别的深度结构模型
本文提出了一种将图形模型和深度神经网络集成到一个联合框架中的方法,在序列推断方面采用递归神经网络的建模,通过对节点之间的边缘施加门来学习推断的适当结构。实证研究表明,这种模型具有处理高度结构化学习任务的潜力,再现了在群体活动识别问题的表现。
Nov, 2015
本文针对视频序列中的团体活动行为分类问题,基于 LSTM 模型构建了一个 2 阶段的深度时间模型,同时考虑了个体和群体层面的动态信息,通过在排球视频数据集上的实验验证了该模型的有效性。
Jul, 2016
通过 LSTM 模型构建 2 阶段深层次模型,从而更好地理解群体活动,利用这些动态实现群体活动识别,实验结果表明,该模型可以有效提高群体活动识别性能。
Nov, 2015
本研究提出了一种新的基于 Transformer 模型的团队活动识别方法,该方法借助注意机制对部分环节进行定位与编码,再对其进行聚合以反映整个活动的完整背景和每个环节的时间演化,无需借助较强的监督方法,在两个基准测试中均表现良好。
Apr, 2022
在计算机视觉领域,团体活动识别是一个热门话题。通过对团体关系进行活动识别,在视频分析、监控、自动驾驶和理解社交活动等各种场景中具有实际意义。本文综述了团体活动识别技术的现有研究进展,重点关注全局交互性和活动。首先,全面回顾了相关文献和各种团体活动识别方法,从传统方法到基于空间结构、描述符、非深度学习、分层循环神经网络(HRNN)、关系模型和注意机制的最新方法。其次,针对每个模块提出了关系网络和关系架构。第三,调查了团体活动识别的方法,并将其性能与最先进的技术进行了比较。总结了现有的挑战,并为新手提供了全面的指导,以便理解团体活动识别。此外,还回顾了团体活动识别中的新视角,探索了新的方向和可能性。
Jul, 2023
本研究提出了一种基于深度强化学习的新方法,通过构建语义关系图来显式地对人之间的关系进行建模,并应用两个代理来逐步优化低层次的空间 - 时间特征和高层次的语义关系,在离散动作空间中,特征蒸馏代理通过提炼最具信息量的关键帧来优化低层次特征,在连续动作空间中,关系门控代理调整高层次的语义图以更多地关注与群体相关的关系,实验结果表明,该方法在两个广泛应用的基准上具有有效性和优越性。
Aug, 2019
本文探讨了一种新型深度结构模型,它可以通过卷积神经网络自适应地将活动实例逐个分解为时间部分,将其进一步分配到深度体系结构的零部件中,有效解决了人类活动识别方面的挑战,此方法已在多种拥有复杂情境的实验中得到了验证。
Dec, 2015
本文提出一种基于 actor-transformer model 认知视频中的个人行为和组群活动的模型,并通过 2D 姿态网络和 3D CNN 等方式提供丰富的个人动态和静态信息表示,从而在公开数据集上取得了显著的效果。
Mar, 2020
提出了一种基于解离图嵌入的物体相互作用图形表示,用于活动识别,该模型通过事实嵌入图结构来解开空间维度与时间变化之间的表示层次结构,并在 Charades 活动识别基准测试以及聚焦于与近碰撞事件的多物体交互的新数据集上进行了验证。
Dec, 2018
提出一种新颖的半监督、多层级顺序生成对抗网络(MLS-GAN)架构来进行群体活动识别,该网络架构利用个人和场景等级的特征,通过 LSTMs 实现映射,通过新颖的门控融合单元进行基于动作的特征融合,学习当前群体活动的中间表示或 “动作代码”,并具有半监督行为,可实现群体动作分类,相较于其他结构表现出更优秀的效果。
Dec, 2018