Jun, 2024

基于残差估计的视频立体匹配的灵活递归网络

TL;DR基于残差估计的递归结构网络 RecSM 用于视频立体匹配,通过计算当前帧与前一帧之间的残差值,仅利用时间上下文作为参考,快速计算当前帧的位移,同时使用 DOM 和 TAM 模块进一步减少估计误差,堆叠式计算结构 (SCS) 实现可扩展性。实验结果表明,RecSM 在一块 NVIDIA RTX 2080TI GPU 上运行 0.054 秒,相比 ACVNet 提高了 4 倍的速度,准确度仅下降 0.7%。