本文提出卷积神经网络模型,将光流估计问题作为监督式学习任务,通过生成合成数据集进行训练,成功实现在计算机视觉领域特别是识别任务中广泛应用的卷积神经网络模型在光流估计任务上的成功率。
Apr, 2015
本文提出了一种基于端到端学习的光流估计方法,该方法通过数据给特定学习任务提供重要信息,并且采用了堆叠式架构及对小运动专门优化的子网络,使得计算速度得到了提升,同时精度与业界领先的方法相当;相比于原始的 FlowNet,FlowNet 2.0 计算速度基本不降反升,估计误差降低了超过 50%。
Dec, 2016
本文提出了 SPyNet (空间金字塔网络) 算法,结合经典的空间金字塔和深度学习来计算光学流的大运动。相较于先前的 FlowNet 方法,SPyNet 更小、更高效,并且能够在标准基准测试中获得更高精度的结果。
Nov, 2016
研究了通过利用运动感知来学习原子部件的方式来提高 Capsule 网络的检测性能,实验证明在多个对象、杂乱背景和遮挡的情况下具有稳定的部分发现能力,其图像解码器可以有效地填充检测到的形状的遮挡部分,该方法可以用于无监督部分分割和无监督图像分类。
Nov, 2020
本文提出了一种基于深度学习和光流的人体姿势估计算法,通过引入时间序列信息和光流辅助,该算法在多个姿态估计数据集上实现了超越当前最先进方法的性能。
Jun, 2015
本文提出了一种基于深度学习的快速且精确的光流预测方法:FastFlowNet,其参数较少,适用于低功耗设备,且在合成和真实数据集上的实验证明了其有效性。
Mar, 2021
本文提出了一种基于卷积神经网络(CNN)的无监督在线学习方法,用于为每帧单独估计运动模型,通过前后向的运动关系实现运动信息的推导,并能够解决非刚性运动估计的主要限制,与没有运动预测的基线相比,在 KITTI 2012、KITTI 2015 和 MPI Sintel 三项基准测试中表现出了长达 27%的一致性改进。
Jun, 2018
TransFlow 是一个基于 Transformer 结构的纯光流估计方法,通过利用空间自注意力机制和跨帧交叉注意力机制,实现更准确的相关性和可信匹配、通过长时序关联恢复更多的损失信息,并通过简单的自学习范式,消除复杂的多阶段预训练程序,在多个任务上实现了最先进的结果。
Apr, 2023
本文提出了一种针对事件相机的全新稠密光流计算方法,通过引入特征相关性与顺序处理的设计思路,相比于现有方案在数据集 MVSEC 上将终点误差降低了 23%,并提出一种新的数据集,更能反映现实场景中物体的运动情况,最终结果的终点误差比之前的方案减少了 66%。
Aug, 2021
本文提出了一种改进的 2D 编码事件数据的 3D 表达方法,并介绍了 3D-FlowNet 网络体系结构以进行光流估计,并采用自监督训练策略来弥补事件相机标记数据的缺乏。结果表明,我们的 3D-FlowNet 具有更好的性能。
Jan, 2022