基于骨架的关系推理用于群体活动分析
本文提出了一个称作Convolutional Relational Machine(CRM)的深度卷积神经网络模型,用于识别图像或视频中的团体活动。该模型利用个体之间的空间关系来产生中间的活动表征,经过多阶段逐步修正,在最后的聚合模块中使用修正后的信息来识别团体活动,并展示了其在Volleyball和Collective Activity数据集上比现有模型具有的优势。
Apr, 2019
本文提出了一种基于深度学习和Actor Relation Graph(ARG)的方法,用于高效地学习和建模多人场景中演员之间的关系,并在两个标准数据集上取得了现有最佳表现
Apr, 2019
我们提出了交互关系网络(Interaction Relational Network),它是一种简单而强大的架构,利用了关于人体结构的最少先验知识,通过定义不同的关系和重要的有结构的成对运算来更好地表示交互,并使用 LSTM 来进行关系推论,实现了与先前最先进的方法相似的结果。
Oct, 2019
本文提出了一个端到端的可训练框架来解决人类活动理解中的社交任务。该框架同时分组人们,预测他们的个人行为和每个社交团体的社交活动,并提供了新的数据集注释。
Jul, 2020
本文介绍了基于多人骨骼的人类动作识别的新方法,利用多尺度时空图卷积网络提取骨骼特征,用多层感知器嵌入参考人和其他人之间的距离值,并通过特征融合和分类得出在HiEve数据集上超越其他技术的最佳性能。
Nov, 2020
本文针对人类行为建模,使用骨架数据训练端到端的状态最新系统,无需精细的个人动作注释即可实现对群体活动的分类识别,但未采用个人行为监督的模型效果较差。同时,本文也提出了伪标签可从任何预训练特征提取器中计算,最终获得与监督模型具有可比性的性能。最后提出的姿态网络架构表现出优异的结果,即使在自监督变体中也可竞争性地胜过更复杂的多模态方法。
May, 2021
提出了一种基于姿势跟踪的团体活动识别方法(POGARS),它采用一维卷积神经网络来学习参与团体活动的个体的时空动态,并使用空间和时间注意机制进行个人重要性推断和多任务学习,与现有方法相比,POGARS 在具有广泛使用的排球数据集上取得了极具竞争力的成果,并表明POGARS比使用RGB作为输入的方法具有更好的泛化性能。
Aug, 2021
本文引入GroupFormer网络解决团体动作识别中空间-时间交互作用的问题,采用聚类的空间-时间变换器动态地将个体群组化,模型个体和群组的特征,融合了空间-时间背景上下文信息。实验结果表明该模型优于现有状态的方法。
Aug, 2021
本论文提出了一种基于注意力模块和transformers模型的社交群组活动识别新框架,该方法在Volleyball和Collective Activity数据集上表现优于现有技术。
Jul, 2022
在计算机视觉领域,团体活动识别是一个热门话题。通过对团体关系进行活动识别,在视频分析、监控、自动驾驶和理解社交活动等各种场景中具有实际意义。本文综述了团体活动识别技术的现有研究进展,重点关注全局交互性和活动。首先,全面回顾了相关文献和各种团体活动识别方法,从传统方法到基于空间结构、描述符、非深度学习、分层循环神经网络(HRNN)、关系模型和注意机制的最新方法。其次,针对每个模块提出了关系网络和关系架构。第三,调查了团体活动识别的方法,并将其性能与最先进的技术进行了比较。总结了现有的挑战,并为新手提供了全面的指导,以便理解团体活动识别。此外,还回顾了团体活动识别中的新视角,探索了新的方向和可能性。
Jul, 2023