- 社会团体活动识别中高效注意力变换器的设计与分析
社会群体活动识别研究了使用注意力模块和变压器来生成社会群体特征,并通过优化设计特征聚合和自注意力模块的方法来提高活动识别效果。
- 使用不可靠的跟踪姿态进行群体活动识别
Rendered Pose based Group Activity Recognition System (RePGARS) is a deep learning-based approach that outperforms exist - REACT:普遍识别每个行为的即刻地点
REACT 是一种新颖的架构,受到了 Transformer 编码器 - 解码器模型的启发,旨在模拟视频中复杂的上下文关系,包括多模态和时空特征的交互。该方法在广泛的实验证明,在识别和理解群体活动方面表现出优越的准确性,为细致的场景理解提供 - 计算机视觉中的群体活动识别:综述,挑战和未来展望
在计算机视觉领域,团体活动识别是一个热门话题。通过对团体关系进行活动识别,在视频分析、监控、自动驾驶和理解社交活动等各种场景中具有实际意义。本文综述了团体活动识别技术的现有研究进展,重点关注全局交互性和活动。首先,全面回顾了相关文献和各种团 - 基于动态组合和交互的团体活动识别
通过提出 DynamicFormer 模型以及 Dynamic composition Module 和 Dynamic interaction Module 来建模人员关系和物体交互,并利用 GCN 和 Multi-level Dynam - 自监督的时空关注社交群体活动识别 (SoGAR)
本文提出了一种使用自我监督变压器网络的社交组活动识别(SoGAR)的新方法,可以有效利用未标记的视频数据,通过利用变化的帧率创建局部和全局视图来提取空时信息,并通过提取来自同一视频的对比视图的特征的自我监督目标,确保跨空时域中的特征是一致的 - MLP-AIR: 基于 MLP 的高效演员交互关系学习方法在团体活动识别中的应用
该论文提出了一种 MLP-AIR 方法用于在团体活动识别任务中学习演员空间和时间互动关系,相较于 GCNs 和 Transformers 的方法,该方法能够获得不错的结果,但具备低复杂度。
- CVPRSPARTAN:自监督时空 Transformer 方法用于群体活动识别
本文提出了一种新的、简单、有效的自我监督空间时间变换器(SPARTAN)方法来使用未标记的视频数据对小组活动识别(GAR)进行识别。该方法采用 encoder 提取视频特征,并进行长期关系建模,通过处理不同的空间尺度和帧率来进行自我监督训练 - CVPRDual-AI: 面向团体活动识别的双路演员相互作用学习
提出 Dual-path Actor Interaction (DualAI) 框架和 Multi-scale Actor Contrastive Loss (MAC-Loss) 方法,通过可灵活布置空间和时间转换器、自监督 actor 一 - CVPR无检测器弱监督群体活动识别
本研究提出了一种新的基于 Transformer 模型的团队活动识别方法,该方法借助注意机制对部分环节进行定位与编码,再对其进行聚合以反映整个活动的完整背景和每个环节的时间演化,无需借助较强的监督方法,在两个基准测试中均表现良好。
- ECCVCOMPOSER: 视频中基于关键点的组群活动的组合推理
使用基于多尺度 Transformer 的 COMPOSER 模型,在仅使用关键点模式的情况下提高群体活动识别精度,并通过预测辅助和数据增强等技术进行模型训练。
- ICCVGroupFormer: 带有空间 - 时间聚类 Transformer 的群体活动识别
本文引入 GroupFormer 网络解决团体动作识别中空间 - 时间交互作用的问题,采用聚类的空间 - 时间变换器动态地将个体群组化,模型个体和群组的特征,融合了空间 - 时间背景上下文信息。实验结果表明该模型优于现有状态的方法。
- ICCV基于时空动态推理网络的群体活动识别
本研究旨在实现对人群活动的识别和研究,通过提出具有动态关系和动态行走模块的动态推理网络(DIN)来实现时空人员特定推理,从而形成人员特定的交互图,并在两个常用数据集中取得了相对于先前最先进方法的显著进展,而推理模块的计算开销要少得多。
- 姿态即可:基于姿态的群体活动识别系统 (POGARS)
提出了一种基于姿势跟踪的团体活动识别方法(POGARS),它采用一维卷积神经网络来学习参与团体活动的个体的时空动态,并使用空间和时间注意机制进行个人重要性推断和多任务学习,与现有方法相比,POGARS 在具有广泛使用的排球数据集上取得了极具 - 从骨架中学习团体活动,无需单独的动作标签
本文针对人类行为建模,使用骨架数据训练端到端的状态最新系统,无需精细的个人动作注释即可实现对群体活动的分类识别,但未采用个人行为监督的模型效果较差。同时,本文也提出了伪标签可从任何预训练特征提取器中计算,最终获得与监督模型具有可比性的性能。 - 基于骨架的关系推理用于群体活动分析
本文提出了一个基于骨架信息的新方法 (GIRN),能够从中直接解释个体之间的交互。该方法将多种关系类型作为独立模块从骨骼信息中推导出来,并利用注意机制将个体不同的关系集成起来。作者在排球数据集上进行了实验,取得了竞争性的效果,提出了基于骨架 - ECCV弱监督群体活动识别的社交适应模块
本文提出了一种名为弱监督组活动识别 (GAR) 的新任务,通过利用社交自适应模块 (SAM) 从嘈杂数据中推理关键人物和帧,改善了 NBA 数据集和常用排球数据集的识别准确率。
- CVPR渐进式关系学习用于群体活动识别
本研究提出了一种基于深度强化学习的新方法,通过构建语义关系图来显式地对人之间的关系进行建模,并应用两个代理来逐步优化低层次的空间 - 时间特征和高层次的语义关系,在离散动作空间中,特征蒸馏代理通过提炼最具信息量的关键帧来优化低层次特征,在连 - 多级序列 GAN 用于组活动识别
提出一种新颖的半监督、多层级顺序生成对抗网络(MLS-GAN)架构来进行群体活动识别,该网络架构利用个人和场景等级的特征,通过 LSTMs 实现映射,通过新颖的门控融合单元进行基于动作的特征融合,学习当前群体活动的中间表示或 “动作代码”, - 分层深度时间模型用于群体活动识别
本文针对视频序列中的团体活动行为分类问题,基于 LSTM 模型构建了一个 2 阶段的深度时间模型,同时考虑了个体和群体层面的动态信息,通过在排球视频数据集上的实验验证了该模型的有效性。