Jan, 2025

多上下文时序一致建模用于视频目标分割

TL;DR本研究解决了当前视频目标分割中查询不一致和上下文考虑不足的问题。我们提出的多上下文时序一致模块(MTCM)通过对查询进行对齐和多上下文增强,显著提升了分割质量,尤其在MeViS数据集上达到了47.6的J