Dec, 2023

TMT-VIS: 视频实例分割的层级感知多数据集联合训练

TL;DR通过提供额外的分类信息,我们提出了一种名为 TMT-VIS 的模型,用于视频实例分割的多数据集联合训练,该模型在四个流行且具有挑战性的基准测试中均显著改善了基线解决方案,并创下了新的最先进记录。