Mar, 2024

视频伪装目标检测中的明确动作处理和交互提示

TL;DR提出了一种新颖的显式动作处理和交互提示框架(EMIP),用于视频伪装目标检测(VCOD)。该框架利用预训练的光流基础模型,通过双流架构实现伪装分割和光流估计,并通过交互提示方式增强两个流的输出。实验结果表明,EMIP 在流行的 VCOD 基准上取得了新的最先进记录。