学习演员关系图用于群体活动识别
本研究提出了一种基于深度强化学习的新方法,通过构建语义关系图来显式地对人之间的关系进行建模,并应用两个代理来逐步优化低层次的空间 - 时间特征和高层次的语义关系,在离散动作空间中,特征蒸馏代理通过提炼最具信息量的关键帧来优化低层次特征,在连续动作空间中,关系门控代理调整高层次的语义图以更多地关注与群体相关的关系,实验结果表明,该方法在两个广泛应用的基准上具有有效性和优越性。
Aug, 2019
本文提出了一种高效的时间推理图 (TRG), 用于同时捕捉视频序列之间的外观特征和时间关系。通过构建可学习的时间关系图来探索多尺度范围上的时间关系。在多头时间邻接矩阵的帮助下,提出了一个多头时间关系聚合器来提取那些通过图卷积计算的特征的语义含义。实验证明,通过我们的 TRG 进行时间关系推理可以提取用于活动识别的判别特征。
Aug, 2019
本文提出一种基于 actor-transformer model 认知视频中的个人行为和组群活动的模型,并通过 2D 姿态网络和 3D CNN 等方式提供丰富的个人动态和静态信息表示,从而在公开数据集上取得了显著的效果。
Mar, 2020
本文提出了一种基于深度神经网络和分层图模型的个人和群体活动监测方案,使用深度网络识别场景中个人的动作,并通过考虑类别间的依赖关系使用神经网络分层图模型完善每个类别的预测标签,该方法能有效改善基准测试方法的识别率。
Jun, 2015
本文提出了一个称作 Convolutional Relational Machine(CRM)的深度卷积神经网络模型,用于识别图像或视频中的团体活动。该模型利用个体之间的空间关系来产生中间的活动表征,经过多阶段逐步修正,在最后的聚合模块中使用修正后的信息来识别团体活动,并展示了其在 Volleyball 和 Collective Activity 数据集上比现有模型具有的优势。
Apr, 2019
本文提出了一种将图形模型和深度神经网络集成到一个联合框架中的方法,在序列推断方面采用递归神经网络的建模,通过对节点之间的边缘施加门来学习推断的适当结构。实证研究表明,这种模型具有处理高度结构化学习任务的潜力,再现了在群体活动识别问题的表现。
Nov, 2015
提出 Dual-path Actor Interaction (DualAI) 框架和 Multi-scale Actor Contrastive Loss (MAC-Loss) 方法,通过可灵活布置空间和时间转换器、自监督 actor 一致性、二交互路径的 Multi-scale Actor Contrastive Loss (MAC-Loss) 等手段,增强演员之间的关系,并通过融合不同演员的特征来提高群体活动识别的性能。在多个数据集上的实验表明,该方法具有很好的推广能力,在有限监督的情况下仍能取得最先进的性能。
Apr, 2022
提出了一种基于解离图嵌入的物体相互作用图形表示,用于活动识别,该模型通过事实嵌入图结构来解开空间维度与时间变化之间的表示层次结构,并在 Charades 活动识别基准测试以及聚焦于与近碰撞事件的多物体交互的新数据集上进行了验证。
Dec, 2018
模型人与场景、物体之间的关系有助于精细化人类行为的区分,有别于现有 3D ConvNets 的方法,而采用 actor-centric relational network 以弱监督方式自动挖掘相关要素计算 pair-wise relation,实现 state-of-the-art 表现。
Jul, 2018
本文提出了一种基于信息传递的图神经网络,能够精确理解视频中行为者、对象和环境之间的关系,在显式表示对象时能够使用显式表示,否则使用隐含表示;在 AVA 和 UCF101-24 的时空行为检测以及最近的 Action Genome 数据集上的视频场景图分类等任务中,实现了最先进的结果,我们定量和定性的显示了我们的方法如何更有效地模拟场景中相关实体之间的关系。
Mar, 2021