Jul, 2023

视频目标分割的层次化时空 Transformer

TL;DR本文提出了一种名为 HST 的半监督视频对象分割框架,使用 Swin Transformer 和 Video Swin Transformer 提取图像和视频特征,并使用内存读取操作产生层次特征以精确重构对象蒙版,该框架在处理复杂场景下具有有效性和鲁棒性,尤其是 HST-B 在多个流行基准测试中优于现有技术。