流媒体视频中的自监督式多角色社交活动理解

Jun, 2024

流媒体视频中的自监督式多角色社交活动理解

Self-supervised Multi-actor Social Activity Understanding in Streaming Videos

Shubham Trehan, Sathyanarayanan N. Aakur

TL;DR在这项研究中，我们提出了一种基于多演员预测学习的自监督方法，用于流媒体视频中的社交活动识别。通过使用视觉语义图结构，我们对社交互动进行建模，从而实现了关系推理，使其在具有最少标记数据的情况下具有鲁棒性表现。该方法在标准群体活动识别基准上取得了竞争性的性能，并通过三个公开可用的动作定位基准的评估证明了其可泛化到任意动作定位的能力。

Abstract

This work addresses the problem of social activity recognition (SAR), a critical component in real-world tasks like surveillance and assistive robotics. Unlike traditional event understanding approaches, SAR nece

social activity recognition surveillance assistive robotics multi-actor predictive learning relational reasoning

发现论文，激发创造

自监督的时空关注社交群体活动识别 (SoGAR)

本文提出了一种使用自我监督变压器网络的社交组活动识别（SoGAR）的新方法，可以有效利用未标记的视频数据，通过利用变化的帧率创建局部和全局视图来提取空时信息，并通过提取来自同一视频的对比视图的特征的自我监督目标，确保跨空时域中的特征是一致的。该方法在使用变压器模型方面具有高效性，可以沿着空时维度建模长期关系，并在三个小组活动识别基准测试中取得了最新的成果，在 F1-score，MCA 和 MPCA 指标方面超越了当前最新技术。

Apr, 2023

社交场景理解：端到端的多人动作定位与集体活动识别

该论文提出了使用神经网络对人类社交行为进行检测和推断的方法，并通过检测和推断的结果实现了对个体和群体行为的估计。该论文在多个公共基准测试上展示了算法的最新性能。

Nov, 2016

基于演员的流视频动作定位表示

在不需要训练标签和轮廓的情况下，通过连续的分层预测学习构建基于注意力的上下文特征，以学习在流媒体视频中本地化动作的鲁棒表示方法。

Apr, 2021

面向少样本动作识别的语义感知视频表示

我们提出了一种简单而有效的语义感知少样本动作识别模型（SAFSAR），该模型通过直接利用 3D 特征提取器与有效的特征融合方案以及简单的余弦相似度分类，实现了更好的性能，无需复杂的距离函数和额外的时间建模组件。在这种方案中，SAFSAR 以一种紧凑的方式实现了对文本语义的编码、视频表示的自适应特征融合，并鼓励视觉编码器提取更具语义一致性的特征。在各种设置下对五个具有挑战性的少样本动作识别基准进行的实验证明，所提出的 SAFSAR 模型显著提高了最先进的性能。

Nov, 2023

弱监督群体活动识别的社交适应模块

本文提出了一种名为弱监督组活动识别 (GAR) 的新任务，通过利用社交自适应模块 (SAM) 从嘈杂数据中推理关键人物和帧，改善了 NBA 数据集和常用排球数据集的识别准确率。

Jul, 2020

基于 Actor-Transformers 的群体活动识别

本文提出一种基于 actor-transformer model 认知视频中的个人行为和组群活动的模型，并通过 2D 姿态网络和 3D CNN 等方式提供丰富的个人动态和静态信息表示，从而在公开数据集上取得了显著的效果。

Mar, 2020

主动学习稀疏半监督动作识别

该研究提出了 SESAR 方法，它将无监督学习和少量有监督学习相结合，通过两个组件对骨骼动作序列进行训练，从而实现骨骼动作识别，其性能超越其他方法，即使只使用 1% 已标记的数据。

Dec, 2020

在视频中联合学习社交群体、个体动作和子群体活动

本文提出了一个端到端的可训练框架来解决人类活动理解中的社交任务。该框架同时分组人们，预测他们的个人行为和每个社交团体的社交活动，并提供了新的数据集注释。

Jul, 2020

演员监督的时空动作定位

本文介绍一种视频动作时空本地化的方法，着重于弱监督学习，只需要视频类标签即可。利用演员在动作中的变换特性，引入基于演员提议的算法及注意力机制，对三个行为数据集进行测试，实验结果表明，该方法在弱监督下可以实现与一些强监督学习相当的性能。

Apr, 2018

SelfAct: 基于自监督和主动学习的个性化活动识别

SelfAct 是一种新颖的人类活动识别框架，结合了自监督和主动学习，通过利用大量未标记的数据进行预训练，学习传感器数据的高效表示，并通过新的无监督主动学习策略进行微调，其结果接近或优于完全监督方法的结果。

Apr, 2023