Jul, 2023

2023 EPIC-KITCHEN 挑战赛中的浙江大学 ReLER 提交:半监督视频目标分割

TL;DR本研究介绍了 MSDeAOT,一种在多个特征尺度上运用 transformers 的 AOT 变体,利用分层的 GPM,以 stride 为 16 的特征尺度高效地从前一帧传播物体掩码至当前帧,同时在具有 stride 为 8 的更精细的特征尺度上应用 GPM,从而提高了检测和跟踪小物体的准确性。通过实现测试时间的数据增强和模型集成技术,我们在 EPIC-KITCHEN VISOR 半监督视频对象分割挑战中取得了排名第一的位置。