Jun, 2024

基于遮罩视频一致性的 VSPW 数据集语义分割

TL;DR我们提出了基于现有模型的基于蒙版视频一致性 (MVC) 的解决方案,通过在预测过程中强制保持遮挡帧之间的一致性来学习蒙版部分的分割结果和视频的前后帧之间的关系,同时采用测试时增强、模型聚合和多模态模型后处理方法,该方法在 VSPW 数据集上获得了 67.27%的 mIoU 性能,在 PVUW2024 挑战 VSS 跟踪中排名第 2。