Jul, 2022

基于 Transformer 的深度腹腔镜立体匹配

TL;DR本文提出了一种新的混合深度立体匹配框架(HybridStereoNet),使用 Transformer 实现特征表示学习,并结合 CNN 用于代价汇聚,旨在提高立体视觉匹配精度和泛化能力。实验结果表明,与其他选项相比,本文方法收敛更快,准确率更高,能够在 Sceneflow,SCARED2019 和 dVPN 数据集上实现卓越的性能。