在线动作检测
该论文探讨了在线检测未修剪视频中动作开始的新颖任务 - 在线开始检测(ODAS)的技术,提出了三种方法来解决 ODAS 模型训练中存在的挑战,包括利用生成对抗网络(GAN)产生艰难的负样本、显式建模动作开始周围数据和后续数据之间的时态一致性以及自适应抽样策略来处理训练数据的稀缺性,进而在 THUMOS'14 和 ActivityNet 上进行广泛实验,证明了提出的方法的显著性能提升和改善先前最先进方法的有效性。
Feb, 2018
本文综述了 200 多篇关于视频动作识别的深度学习论文,介绍了 17 个影响模型设计的数据集和深度学习模型的发展历程,包括深度学习适应、双流网络、3D 卷积核和计算效率模型,并对几种方法在典型数据集上进行了基准测试,最后,讨论了视频动作识别面临的问题和未来的研究机会。
Dec, 2020
本文旨在探讨在视频动作检测中,除数据集规模外其他能够衡量数据集质量的属性,并且提出了一个新的,适用于真实世界应用的多演员多行为(MAMA)数据集,同时还对影响视频数据集的时间关系进行了相关性研究,进而发现现有方法存在偏见。
Apr, 2022
StartNet 是一种面向在线检测行动开始(ODAS)的解决方案,其中使用 ClsNet 进行动作分类并使用 LocNet 进行开始点定位,评估表明其在 THUMOS'14 上的性能比现有技术提高了 15%-30%p-mAP,在 ActivityNet 上的性能与 10 倍较小的时间偏移相当。
Mar, 2019
介绍了一个大规模的现实世界数据集,该数据集用于评估人类行为识别的学习技术,进一步提出了在无人干预状态下收集数据和训练的方法,并针对该训练数据出现的语义不一致性问题,提出了一个语义分层结构。
Jun, 2019
本文提出了一种新颖的框架 Temporal Recurrent Network (TRN) 来模拟视频帧的时间上下文,在线执行行动检测并预测即将发生的行动,实现了累积历史证据和预测未来信息相结合的在线识别方式,并在 HDD、TVSeries 和 THUMOS'14 三个数据集上进行评估,表明 TRN 的性能显著优于现有技术。
Nov, 2018
通过结合动作预测和在线动作检测,我们提出了一种统一的模型 JOADAA,能够覆盖在线动作检测中未来信息的缺失依赖关系,并在 THUMOS'14、CHARADES 和 Multi-THUMOS 三个具有挑战性的数据集上取得了最优结果。
Sep, 2023
在线临时动作分割通过改进的训练和推理方法提高了骨干动作识别模型的训练和在线帧级分类性能,可用于实时 HRI 任务,尤其在处理细粒度数据集时表现出色。
Apr, 2024
本文研究了如何从流媒体骨架数据中实时监测并识别出人类动作,并提出了一种基于神经网络的多任务分类回归模型来更准确地定位动作类型和时间位置信息,该模型具有较高的计算效率和准确性。
Apr, 2016