视频分类的光流特征幻象

IJCAIMay, 2019

Hallucinating Optical Flow Features for Video Classification

Yongyi Tang, Lin Ma, Lianqiang Zhou

TL;DR本文提出了一种名为 MoNet 的运动幻觉网络，通过从外观特征想象光流特征，而无需依赖光流计算，大幅度提高了视频分类性能，同时能够帮助削减一半的计算和数据存储负担。

Abstract

Appearance and motion are two key components to depict and characterize the video content. Currently, the two-stream models have achieved state-of-the-art performances on video classification. However, extracting

video classification two-stream models motion hallucination network optical flow features monet

发现论文，激发创造

静态图像的动作幻觉用于动作识别的 Im2Flow 算法

通过一个 encoder-decoder CNN 和 optical flow 方法，我们的研究为静态图像动作识别提供了一个新方法，即学习一个短期动态先验，在新的静态图像上推断预期的光流，成功地将学习的动作转移至标准的两流网络中，并且在七个数据集上表现出了良好的性能。

Dec, 2017

ActionFlowNet：学习动作表示以进行动作识别

我们提出了一种多任务学习模型 ActionFlowNet，将外部光流数据输入到卷积神经网络中，同时训练网络以从原始像素中直接识别动作和估计光流，从而捕捉单个模型中的外观和运动信息，提高动作识别准确率。

Dec, 2016

视频理解的动作表示端到端学习

提出了一种名为 TVNet 的新型端到端可训练神经网络，能够从数据中学习类似光流的特征，通过端到端训练可以进一步微调 TVNet 的参数以学习更丰富的和任务特定的模式，实验证明该方法在动作识别方面比所有对比方法都更准确，同时在特征提取时间方面与当前最快的对手相当。

Apr, 2018

通过单个运动模糊图像的光流估计

该研究提出了一种新的框架，利用 Transformer 网络从单个运动模糊图像中端到端地估计光流，并通过粗到细的方式评估了该模型的性能和应用。

Mar, 2021

使用卷积网络学习光流

本文提出卷积神经网络模型，将光流估计问题作为监督式学习任务，通过生成合成数据集进行训练，成功实现在计算机视觉领域特别是识别任务中广泛应用的卷积神经网络模型在光流估计任务上的成功率。

Apr, 2015

自我监督学习的跨像素光流相似度

采用动态光流来监督静态图像的表示，通过学习嵌入像素以达到其光流向量之间的相似性，我们设计了一种无需手工标注的学习卷积神经图像表示的新方法，这个新方法优于以往的运用动态光流学习卷积神经网络的方法，并在语义分割等领域首屈一指。

Jul, 2018

非模态光流

通过引入 Amodal Optical Flow 来解决透明或被遮挡物体造成的光流估计挑战，将可见区域与被遮挡区域结合起来形成的多层级像素级运动场景，提出了 AmodalSynthDrive 数据集来帮助研究该任务，并提供了强基准、Amodal Flow Quality 度量和 AmodalFlowNet 模型作为解决该任务的初步尝试，并证明其在广泛实验中的易处理性和在诸如全景跟踪等下游任务中的实用性。

Nov, 2023

MemFlow: 光流估计与记忆预测

MemFlow 是一种实时的光流估计和预测方法，通过使用内存中的历史运动信息实现光流的估计和预测，并通过适应不同视频分辨率来提高性能。

Apr, 2024

从静止图像中学习光流

本文介绍了一种从真实图片中快速生成大量准确的光流标注的框架，该框架利用单目深度估计网络构建可能的点云，通过虚拟相机运动合成新视角和对应的光流场，实现对现有数据的有效利用，并提高了视觉光流网络在真实场景中的泛化和特化性能。

Apr, 2021

光流引导特征：视频动作识别的快速稳健运动表示

本研究提出了一种名为 OFF 的紧凑型动作表示法，通过直接计算深度特征图的像素空间梯度，能够嵌入现有的 CNN 网络进行视频动作识别，从而快速提取时空信息，实现了比两种流（RGB 和光流）快 15 倍的速度和与之相似的精度。

Nov, 2017