Apr, 2024

运用视觉基础模型在立体匹配中的优势

TL;DR该研究是首次探索一种可行的方法,将 VFMs 适应于立体匹配,并通过将 ViTAS 与基于代价体积的立体匹配后端处理相结合,在 KITTI Stereo 2012 数据集上取得了最高排名,并以误差像素比例方面优于次优网络 StereoBase 约 7.9%,3 个像素误差容差。在各种情境的附加实验进一步证明了其与所有其他最先进方法相比的卓越通用性。我们相信这种新范式将为下一代立体匹配网络铺平道路。