使用细化动态矢量的压缩视频动作识别

Oct, 2019

使用细化动态矢量的压缩视频动作识别

Compressed Video Action Recognition with Refined Motion Vector

Haoyuan Cao, Shining Yu, Jiashi Feng

TL;DR本文提出了一种有效地利用现代视频压缩技术的运动矢量和残余的方法来学习原始帧的表征，并大大减少时域冗余，从而提高视频处理模型的速度。通过用优化的方法去除不可靠的运动信息，我们取得了与 CoViAR 同样好的结果。

Abstract

Although cnn has reached satisfactory performance in image-related tasks, using cnn to process videos is much more challenging due to the enormous size of raw video streams. In this work, we propose to use

cnn video processing motion vectors video compression deep neural network

发现论文，激发创造

增强型运动向量卷积神经网络实时动作识别

通过用运动矢量直接代替计算光流来加速双流架构，然后通过初始化转移、监督转移和它们的组合，将光流 CNN 中学习的知识转移到运动矢量 CNN 中，以提高后者的性能。实验结果表明，该方法的识别性能可与最先进的方法相媲美，同时处理速度比原始的双流方法快 27 倍。

Apr, 2016

压缩视频动作识别

通过对压缩视频进行深度网络培训，利用视频压缩技术，获得了更高密度的信息、4.6 倍于 Res3D 和 2.7 倍于 ResNet-152 的速度以及在 UCF-101、HMDB-51 和 Charades 数据集上均优于其他方法的性能。

Dec, 2017

模拟原始域：在压缩领域中加速动作识别

本文提出了一种基于压缩视频领域的新方法，旨在通过利用运动向量和残差来加速计算并减少网络参数，在三个常用数据集上实验表明该模型不仅能够保持较高的准确率还具备更高的识别效率。

Nov, 2019

MVFlow：具有运动矢量先验的压缩视频深度光流估计

使用运动矢量来提高压缩视频的光流估计的速度和准确性，构建了四个包含帧和运动矢量的压缩视频光流数据集，实验证明 MVFlow 相对现有模型减少 1.09 AEPE 或节省 52% 时间来达到类似准确性。

Aug, 2023

DMC-Net: 为快速压缩视频动作识别生成具有区分性的动作线索

该研究提出一种轻型的生成网络，用于提高压缩视频中噪声较多的运动向量的信噪比和准确性，从而实现更具有辨别力的运动提示 (DMC) 表示，并在行动识别任务中进行了联合训练，从而接近于光流使用的高精度；该方法在三个行动识别数据集上进行了广泛的评估，并证实了其有效性。

Jan, 2019

一种用于动作识别的强大高效的视频表示方法

本文旨在介绍一种最先进的视频表示方法并将其应用于高效的动作识别和检测。我们采用密集轨迹特征提取等一系列方法来改进该方法，并比较了传统基于单词包直方图的编码方法以及 Fisher 向量编码方法在视频识别任务中的表现。实验结果表明，我们提出的改进轨迹特征显着优于传统的密集轨迹方法，并且 Fisher 向量编码方法表现更好。

Apr, 2015

移动视频动作识别

本文研究了在移动设备上的视频动作识别任务，提出了一个基于 MobileNetV2 和 Temporal Trilinear Pooling (TTP) 模块的方法，使用多种模态处理压缩视频，并进行了效率测试，结果表明我们的模型在移动设备上可以实现 40FPS 的识别速度，且在模型大小和时间消耗方面表现优异。

Aug, 2019

通过渐进式知识蒸馏推进压缩视频动作识别

通过压缩视频动作识别，利用压缩视频中的不同模态（运动矢量、残差和帧内数据）对视频样本进行分类，本研究提出了逐步知识蒸馏（PKD）和加权推理与缩放集成（WISE）两种策略，通过知识传递和模态间的层级收敛关系，提高内部分类器（IC）的准确性，并在实验中证明了它们对 UCF-101 和 HMDB-51 数据集准确率的改善。

Jul, 2024

压缩视频中的快速目标检测

该论文提出了使用 Motion aided Memory Network (MMNet) 进行快速目标检测的方法，并取得了较高的检测效果，验证了这种方法在压缩视频上的可行性。

Nov, 2018

基于 H.264 运动矢量的高效时序感知 DeepFake 检测

利用 H.264 视频编解码器中的运动矢量和信息掩码来检测 DeepFakes 中的时间不一致性，该方法在有效性和计算成本方面表现出色，可用于视频通话和流媒体的实时时间感知 DeepFake 检测方法。

Nov, 2023