PWC-Net:使用金字塔、光流矫正和代价体积的卷积神经网络
通过简单和成熟的原则,包括金字塔处理,扭曲和成本体积处理,我们设计了一种紧凑但有效的 CNN 模型 PWC-Net 进行光流估计,并通过相同的训练过程对 FlowNetC 进行重新训练,提高了 56% 的准确性,并进一步改进了训练过程,将 PWC-Net 在 Sintel 上的准确性提高了 10%,在 KITTI 2012 和 2015 上提高了 20%,该模型在 Robust Vision Challenge 的光流比赛中获胜。
Sep, 2018
本文提出了 SPyNet (空间金字塔网络) 算法,结合经典的空间金字塔和深度学习来计算光学流的大运动。相较于先前的 FlowNet 方法,SPyNet 更小、更高效,并且能够在标准基准测试中获得更高精度的结果。
Nov, 2016
本文提出了一种新颖的端对端深度场景流模型 PointPWC-Net,通过粗到细的方式处理 3D 点云数据,包括新型的成本体量、上采样和变形层来有效地处理 3D 点云数据,利用自监督损失进行训练。实验结果表明,在 FlyingThings3D 数据集上超过了现有技术,并且在未经微调的情况下,在 KITTI Scene Flow 2015 数据集上表现出很好的泛化能力,优于所有先前的方法。
Nov, 2019
本文提出了一个名为 LiteFlowNet2 的网络,主要用于光流估计问题,它使用卷积神经网络来计算光流,同时使用流正则化来解决异常和模糊问题,并实现了特征扭曲,而不是像 FlowNet2 和 SPyNet 那样变换图像,这通过轻量级级联流推理提高了速度,同时对 Sintel 和 KITTI 数据集的表现比 FlowNet2 更好,并且模型大小要小 25.3 倍,比运行速度要快 3.1 倍。
Mar, 2019
该研究提出了一种名为 PCW-Net 的深度学习模型,它利用代价体积、金字塔结构和图像拉伸等先进技术,在实现跨域泛化的同时提高立体匹配的准确性,其在 KITTI 2012 和 Argoverse 等数据集上取得了最好的性能。
Jun, 2020
本文介绍了一种新的神经网络,通过轻量级级联网络、流规则化层和特征提取的结构来提高光流估计的准确度,并且比现有的 FlowNet2 在模型大小和运行速度等方面都有所优化。
May, 2018
本文提出了一种基于深度学习的快速且精确的光流预测方法:FastFlowNet,其参数较少,适用于低功耗设备,且在合成和真实数据集上的实验证明了其有效性。
Mar, 2021
通过金字塔可变卷积结构和上下文增强网络,我们提出了一种称为 Pyramid Deformable Warping Network(PDWN)的轻量而有效的模型,可用于视频帧插值。该方法使用粗到细的连续细化来生成未知中间帧相对于已知帧的 DConv 偏移,并在每个金字塔级别计算扭曲特性之间的成本卷积以帮助偏移量推断。在最细的尺度上,这两个扭曲帧被自适应地混合以生成中间帧,其准确性可与同类模型相媲美甚至更优。
Apr, 2021
本文提出了一种基于端到端学习的光流估计方法,该方法通过数据给特定学习任务提供重要信息,并且采用了堆叠式架构及对小运动专门优化的子网络,使得计算速度得到了提升,同时精度与业界领先的方法相当;相比于原始的 FlowNet,FlowNet 2.0 计算速度基本不降反升,估计误差降低了超过 50%。
Dec, 2016
本文提出了一种名为 PWCLO-Net 的新颖的三维点云学习模型,用于深度 LiDAR 计算机视觉里程计,通过构建具有金字塔、翘曲和成本卷积(PWC)结构的模型,以逐渐精细的方法细化估计的姿态,建立一个关注成本卷积的、可训练的嵌入层,用以关联两个点云并获得嵌入式运动模式,以及提出了一种新的可训练嵌入掩模,以加权所有点的局部运动模式,以回归整体位姿并过滤离群点。
Dec, 2020