关键词video action detection
搜索结果 - 8
- AAAI半监督主动学习视频行为检测
本文主要研究标签高效学习、视频动作检测、半监督主动学习、信息样本选择和时空定位等主题。提出了一个半监督主动学习方法,利用标记和未标记数据以及信息样本选择来进行动作检测。通过提出的噪声增强和基于高通滤波的关注机制(fft-attention) - 利用 Token Dropout 和上下文细化提高视频动作检测效率
本文提出了一种基于视觉句子转换器的高效视频动作检测框架(EVAD),其中包含两个专门用于视频动作检测的设计:从关键帧 - centric 视角提取时空令牌进行中间特征显著化,通过利用剩余令牌来细化场景环境来获得精确的演员身份识别,该框架可将 - CVPRSTMixer:一阶段稀疏动作检测器
该论文提出了一种新的一阶稀疏行动检测器 STMixer,它采用了基于查询的自适应特征采样模块和双分支特征混合模块,可以在 AVD,UCF101-24 和 JHMDB 数据集上取得最佳成果。
- CVPR视频动作检测:分析限制和挑战
本文旨在探讨在视频动作检测中,除数据集规模外其他能够衡量数据集质量的属性,并且提出了一个新的,适用于真实世界应用的多演员多行为(MAMA)数据集,同时还对影响视频数据集的时间关系进行了相关性研究,进而发现现有方法存在偏见。
- CVPR视频动作检测端到端半监督学习
提出一种利用半监督学习方法,结合已标注和未标注数据对视频行为检测进行改进的方法,其中使用分类一致性和时空一致性约束,提出了两个新的正则化约束条件,即时间相关性和梯度平滑性,以处理视频中存在的背景和固定区域,进而实现更好的检测效果。在 UCF - ECCV上下文感知 RCNN:视频中动作检测的基线
使用 Context-Aware RCNN 方法,将 RoI-Pooling 基于管道的惯常思维挑战,填补了视频行为检测中的空白,迎来了新的思路。
- 异步交互聚合用于动作检测
通过异步交互聚合网络 (AIA) 和交互聚合结构 (IA) 进行多类型交互模型和整合,以及异步记忆更新算法 (AMU),动态建模长期交互,极大地提高了视频动作检测的性能,并在 AVA 数据集上实现了新的最佳性能。
- MM视频动作检测的长短期关系网络
本文提出了一种新的长短期关系网络(LSTR),通过空时注意机制建模视频内的短期人类 - 背景关系,并通过级联方式使用图卷积网络(GCN)推理长期时空动态,从而增强视频动作检测的特征表现。在四个基准数据集上进行广泛实验,与现有方法相比,取得了