基于胶囊网络的光流估计 CapsFlow

Apr, 2023

CapsFlow: Optical Flow Estimation with Capsule Networks

Rahul Chand, Rajat Arora, K Ram Prabhakar, R Venkatesh Babu

TL;DR本文提出了使用胶囊网络处理光流问题的框架，并展示了在小型数据集上胶囊网络的表现优于 FlowNetC 和 PWC-Net 等模型的结果。

Abstract

We present a framework to use recently introduced capsule networks for solving the problem of optical flow, one of the fundamental computer visio

capsule networks optical flow computer vision deep architectures spatio-temporal features

发现论文，激发创造

使用卷积网络学习光流

本文提出卷积神经网络模型，将光流估计问题作为监督式学习任务，通过生成合成数据集进行训练，成功实现在计算机视觉领域特别是识别任务中广泛应用的卷积神经网络模型在光流估计任务上的成功率。

Apr, 2015

FlowNet 2.0: 使用深度网络演化的光流估计

本文提出了一种基于端到端学习的光流估计方法，该方法通过数据给特定学习任务提供重要信息，并且采用了堆叠式架构及对小运动专门优化的子网络，使得计算速度得到了提升，同时精度与业界领先的方法相当；相比于原始的 FlowNet，FlowNet 2.0 计算速度基本不降反升，估计误差降低了超过 50%。

Dec, 2016

使用空间金字塔网络估计光流

本文提出了 SPyNet (空间金字塔网络) 算法，结合经典的空间金字塔和深度学习来计算光学流的大运动。相较于先前的 FlowNet 方法，SPyNet 更小、更高效，并且能够在标准基准测试中获得更高精度的结果。

Nov, 2016

基于流动胶囊的无监督式部分表示

研究了通过利用运动感知来学习原子部件的方式来提高 Capsule 网络的检测性能，实验证明在多个对象、杂乱背景和遮挡的情况下具有稳定的部分发现能力，其图像解码器可以有效地填充检测到的形状的遮挡部分，该方法可以用于无监督部分分割和无监督图像分类。

Nov, 2020

视频人体姿势估计的流动卷积神经网络

本文提出了一种基于深度学习和光流的人体姿势估计算法，通过引入时间序列信息和光流辅助，该算法在多个姿态估计数据集上实现了超越当前最先进方法的性能。

Jun, 2015

FastFlowNet：一种轻量级网络用于快速光流估计

本文提出了一种基于深度学习的快速且精确的光流预测方法：FastFlowNet，其参数较少，适用于低功耗设备，且在合成和真实数据集上的实验证明了其有效性。

Mar, 2021

ProFlow: 光流预测学习

本文提出了一种基于卷积神经网络（CNN）的无监督在线学习方法，用于为每帧单独估计运动模型，通过前后向的运动关系实现运动信息的推导，并能够解决非刚性运动估计的主要限制，与没有运动预测的基线相比，在 KITTI 2012、KITTI 2015 和 MPI Sintel 三项基准测试中表现出了长达 27％的一致性改进。

Jun, 2018

TransFlow: Transformer 作为流学习器

TransFlow 是一个基于 Transformer 结构的纯光流估计方法，通过利用空间自注意力机制和跨帧交叉注意力机制，实现更准确的相关性和可信匹配、通过长时序关联恢复更多的损失信息，并通过简单的自学习范式，消除复杂的多阶段预训练程序，在多个任务上实现了最先进的结果。

Apr, 2023

E-RAFT: 来自事件相机的稠密光流

本文提出了一种针对事件相机的全新稠密光流计算方法，通过引入特征相关性与顺序处理的设计思路，相比于现有方案在数据集 MVSEC 上将终点误差降低了 23％，并提出一种新的数据集，更能反映现实场景中物体的运动情况，最终结果的终点误差比之前的方案减少了 66%。

Aug, 2021

3D-FlowNet：使用三维表示的事件驱动光流估计

本文提出了一种改进的 2D 编码事件数据的 3D 表达方法，并介绍了 3D-FlowNet 网络体系结构以进行光流估计，并采用自监督训练策略来弥补事件相机标记数据的缺乏。结果表明，我们的 3D-FlowNet 具有更好的性能。

Jan, 2022