关键词spatio-temporal action detection
搜索结果 - 10
- 开放词汇空间时间动作检测
通过对现有 STAD 数据集建立两个基准,并提出基于预训练视频 - 语言模型的简单而有效的方法,我们在新的类别上取得了令人期待的性能,通过训练一个在有限的基本类别上的模型来具备好的泛化性能。
- 基于深度学习的时空动作检测综述
本文综述了基于深度学习的时空动作检测(STAD)的最新方法及其性能评估,讨论了相关研究的潜在方向。
- CVPR时空动作定位的关系建模
本文提出一种用于动作识别的多类型关系建模方法,并采用训练策略将多种关系建模集成到两个大规模视频数据集的端对端训练中去。同时,结合记忆库的学习和面向长尾数据分布的微调方法,以进一步提高性能,最终在 AVA-Kinetics 测试集中实现了 4 - ICCVMultiSports:一个时空定位的多人体育动作视频数据集
本文介绍了一个新的多人数据集 MultiSports,用于检测时空定位的体育动作,提供了一组细致的标注,以便作为未来时空动作检测的标准基准。
- 视频中的动作检测变形管网
本研究提出了一种由 Deformation Tube Proposal Network(DTPN)和 Deformable Tube Recognition Network(DTRN)组成的 Deformable Tube Network, - CVPRTACNet:面向时空动作检测的过渡感知上下文网络
本研究提出了一种过渡状态感知上下文网络(TACNet),用于解决当前时空动作检测在时间范围检测方面的不足。通过分类动作和过渡状态,实现了过渡状态的区分,从而可以显著提高 TDIDF 在行动检测上的表现。
- CVPRSTEP: 视频动作检测的时空渐进学习
本文提出了一个逐步学习的动作检测框架,通过逐步改善提取物体框的精度以捕获视频中的动作。我们在 UCF101 和 AVA 数据集上验证了该框架,获得了显著的检测结果。
- 基于提议的未修剪视频时空动作检测解决方案
本文提出了一种基于对象检测的两阶段模块化系统,用于在未裁剪的安全视频中进行时空动作检测,第一阶段使用层次聚类和时间抖动技术生成稠密的时空建议,第二阶段是一个 TRI-3D 网络,在生成的提议上执行动作分类和时态细化。实验结果表明本文提出的方 - 一种灵活的动作定位训练模型,具有不同程度的监督
提出了一种基于磁盘聚类的统一框架,它可以处理和结合不同类型的较低需求的弱监督,从视频中监测时空活动,并将其应用于训练设置中的不同类型的监督信号实验结果证明:该模型在 UC101-24 和 DALY 数据集上具有竞争性能,而且与之前的方法相比 - 级联建议和位置预测的时空动作检测
本研究针对视频中时间未被截断的情况下的时空动作检测问题,提出了基于级联提议和位置预测 (CPLA) 模型的帧级动作检测方法,其中采用了级联区域提议网络 (casRPN) 来生成动作提议,利用位置预测网络 (LAN) 对动作的时空一致性进行了