MMJul, 2022

用于压缩视频物体指代分割的多注意力网络

TL;DR本文提出了在压缩视频数据流上进行指代视频目标分割任务的多关注机制网络和基于查询的跨模态 Transformer 模块,实现了使用单核心直接生成最终分割掩模的复杂后处理过程的目标,结果表明其有效性。