CVPRApr, 2023

MED-VT:多尺度编码器 - 解码器视频 Transformer 及其在对象分割中的应用

TL;DR本文提出了一种统一的多尺度编码 - 解码变形器,重点针对视频中的密集预测任务,利用编码器和解码器的多尺度表示提取时空特征以及进行精确的定位,同时采用多对多标签传播的转导学习方案,实现高精度视频对象分割和演员 / 动作分割。