提出了一种基于稀疏点和神经网络的代价聚合方法,用于加速立体匹配的推理速度,并在 KITTI 数据集上取得了有竞争力的结果。
Apr, 2020
本研究以深度学习的 cost aggregation 理论为基础,提出了使用两路神经网络进行视差匹配的方法,并在 KITTI 和 Scene Flow 等数据集上进行全面实验。实验表明,本方法在性能上胜过了目前的最先进方法。
Jan, 2018
本论文介绍了一种基于 Transformer 的综合特征和成本聚合网络,用于密集匹配任务。我们展示了特征聚合和成本聚合的不同特点,并介绍了一种简单而有效的架构,利用自注意力机制和互注意力机制来统一特征聚合和成本聚合,从而在语义匹配和几何匹配任务中实现了显著的改进。
Mar, 2024
基于学习的多视点立体匹配,我们提出了一种晚期聚合方法,通过整个网络前馈过程对成对成本进行聚合,实现准确的估计,并且仅对普通 CasMVSNet 进行微小改变,从而使后续的深度网络充分利用关键的几何线索。
Jan, 2024
本论文提出了一种实用的建立图像间稠密一一对应的方法,利用像素的上下文信息估计本地尺度,并使用三种方法在整个图像中保持比例不变特征提取,有效地解决了局部尺度不同的问题,实现了不同图像之间的准确的稠密对应,且计算成本较小。
Jun, 2014
本文提出了使用分组相关来构建成本体积,并改进了三维堆叠沙漏网络,以用于立体匹配的深度感知,通过实验证明在 Scene Flow、KITI 2012 和 KITTI 2015 数据集上,该方法优于之前的方法。
Mar, 2019
提出了一种名为 GoMVS 的方法,通过几何一致的传播和聚合,以更好地利用相邻几何结构,从而使成本聚合更加准确和有效。在 DTU、Tanks & Temple 和 ETH3D 数据集上取得了最新的最高性能,特别是在 Tanks & Temple Advanced 基准测试上排名第一。
Apr, 2024
介绍了一个多尺度框架来实现低级视觉任务,使用图像的密集、重叠的多个尺度进行估计,表明该框架在双目视觉任务上表现良好,并生成适合结合高级推理和其他低级线索的分布式场景表达式。
Nov, 2014
本研究提出一种名为 Cost Aggregation Transformers (CATs) 的新型 cost aggregation network,以解决大规模几何和出现变化情况下的图像语义相似性匹配问题,利用全局的自我注意机制消除初始相关图之间的不准确匹配,通过外观关联建模辅助 cost 聚合过程,创新地定位多级聚合模块,加入交换注意力机制和残差连接来提高性能。
Jun, 2021
本文提出了一种既节省时间又节省内存的立体成像方法,该方法在几何和语境的渐进细化尺度中构建标准的特征金字塔下的代价体,随着不断增加的代价体分辨率以及深度(或差异)间隙的自适应调整,以较粗糙的方式从粗到细恢复输出。
Dec, 2019