CVPRMar, 2023

MobileVOS:实时视频目标分割,对比学习与知识蒸馏相遇

TL;DR本文提出一种基于知识蒸馏与像素对比学习相结合的理论框架并使用有限内存的小型空时存储网络,实现在资源受限的设备上进行半监督视频对象分割任务,与最先进的模型相比取得竞争性的 J&F 评估结果,但计算成本只有最先进模型的一小部分,在三星 Galaxy S22 上每帧计算 32 毫秒,并验证了该理论框架在标准 DAVIS 和 YouTube 基准测试上的有效性。