May, 2024

MCDS-VSS:基于自监督几何和运动滤波的移动相机动态场景视频语义分割

TL;DR我们提出了 MCDS-VSS,这是一种结构化滤波模型,通过自监督学习来估计场景几何和相机自运动,并估计外部物体的运动,从而提高语义分割的时间一致性。我们的模型将汽车场景解析为多个解耦的可解释表示,例如场景几何、自运动和物体运动,并在保持竞争性分割性能的同时实现了优越的时间一致性。