关键词spatio-temporal action localization
搜索结果 - 6
- ECCVCFAD: 空时动作粗定位器
本文提出了一种 Coarse-to-Fine Action Detector (CFAD) 框架,用于高效的时空动作定位,该框架将视频流分为粗动作管和精细动作管,分别利用长时信息建立粗管,并在关键时间戳的指导下选择性地调整管的位置。实验结果 - 2020 年 ActivityNet 竞赛中 AVA-Kinetics 交叉赛道第一名解决方案
本文介绍了我们在 ActivityNet Challenge 2020 竞赛中获胜的解决方案,该方案主要基于演员 - 背景 - 演员关系网络,在 AVA-Kinetics 数据集上实验,并取得了 39.62 mAP 的高分。
- CVPR通过渐进式跨流协作改善行为定位
本文提出了一种新的渐进式交叉流合作(PCSC)框架,以使用来自一个流(即流 / RGB)的区域提议和特征来帮助另一个流(即 RGB / 流)以迭代方式改进动作定位结果并生成更好的边界框。
- ECCV演员中心关系网络
模型人与场景、物体之间的关系有助于精细化人类行为的区分,有别于现有 3D ConvNets 的方法,而采用 actor-centric relational network 以弱监督方式自动挖掘相关要素计算 pair-wise relati - 时空动作定位的 Action Tubelet 检测器
本文通过提出 ACT-detector,结合对象检测中的 anchor boxes 思想,利用视频的时间连续性进行动作检测,结果表明在 J-HMDB 和 UCF-101 数据集上,我们的 ACT-detector 检测方法在帧 - 平均精度 - 学习跟踪以进行时空动作定位
这篇论文提出了一种有效的方法,通过联合静态和运动的 CNN 特征对视频进行帧级别的检测,并通过目标追踪、运动直方图和滑动窗口法实现了时空行为定位,其准确性比现有方法提高了 15%至 12%不等。