使用细化动态矢量的压缩视频动作识别
通过用运动矢量直接代替计算光流来加速双流架构,然后通过初始化转移、监督转移和它们的组合,将光流 CNN 中学习的知识转移到运动矢量 CNN 中,以提高后者的性能。实验结果表明,该方法的识别性能可与最先进的方法相媲美,同时处理速度比原始的双流方法快 27 倍。
Apr, 2016
通过对压缩视频进行深度网络培训,利用视频压缩技术,获得了更高密度的信息、4.6 倍于 Res3D 和 2.7 倍于 ResNet-152 的速度以及在 UCF-101、HMDB-51 和 Charades 数据集上均优于其他方法的性能。
Dec, 2017
本文提出了一种基于压缩视频领域的新方法,旨在通过利用运动向量和残差来加速计算并减少网络参数,在三个常用数据集上实验表明该模型不仅能够保持较高的准确率还具备更高的识别效率。
Nov, 2019
使用运动矢量来提高压缩视频的光流估计的速度和准确性,构建了四个包含帧和运动矢量的压缩视频光流数据集,实验证明 MVFlow 相对现有模型减少 1.09 AEPE 或节省 52% 时间来达到类似准确性。
Aug, 2023
该研究提出一种轻型的生成网络,用于提高压缩视频中噪声较多的运动向量的信噪比和准确性,从而实现更具有辨别力的运动提示 (DMC) 表示,并在行动识别任务中进行了联合训练,从而接近于光流使用的高精度;该方法在三个行动识别数据集上进行了广泛的评估,并证实了其有效性。
Jan, 2019
本文旨在介绍一种最先进的视频表示方法并将其应用于高效的动作识别和检测。我们采用密集轨迹特征提取等一系列方法来改进该方法,并比较了传统基于单词包直方图的编码方法以及 Fisher 向量编码方法在视频识别任务中的表现。实验结果表明,我们提出的改进轨迹特征显着优于传统的密集轨迹方法,并且 Fisher 向量编码方法表现更好。
Apr, 2015
本文研究了在移动设备上的视频动作识别任务,提出了一个基于 MobileNetV2 和 Temporal Trilinear Pooling (TTP) 模块的方法,使用多种模态处理压缩视频,并进行了效率测试,结果表明我们的模型在移动设备上可以实现 40FPS 的识别速度,且在模型大小和时间消耗方面表现优异。
Aug, 2019
通过压缩视频动作识别,利用压缩视频中的不同模态(运动矢量、残差和帧内数据)对视频样本进行分类,本研究提出了逐步知识蒸馏(PKD)和加权推理与缩放集成(WISE)两种策略,通过知识传递和模态间的层级收敛关系,提高内部分类器(IC)的准确性,并在实验中证明了它们对 UCF-101 和 HMDB-51 数据集准确率的改善。
Jul, 2024
该论文提出了使用 Motion aided Memory Network (MMNet) 进行快速目标检测的方法,并取得了较高的检测效果,验证了这种方法在压缩视频上的可行性。
Nov, 2018
利用 H.264 视频编解码器中的运动矢量和信息掩码来检测 DeepFakes 中的时间不一致性,该方法在有效性和计算成本方面表现出色,可用于视频通话和流媒体的实时时间感知 DeepFake 检测方法。
Nov, 2023