CVPRJun, 2024

RMem: 受限内存存储改进视频对象分割

TL;DR通过限制记忆库的规模,我们在视频目标分割模块(VOS)中实现了显著的提高。这个过程平衡了帧的重要性和新鲜度,以维持一个有限容量的信息性记忆库,并降低了训练 - 推理过程中记忆长度的差异,从而在时间推理方面开辟了新的机遇。最终,我们通过 “RMem”(即 “R” 表示限制)将这些见解体现出来,这是一个简单而有效的在具有挑战性的 VOS 场景中取得卓越表现的 VOS 修改方法,并在目标状态变化方面(在 VOST 数据集上)和长视频方面(在长视频数据集上)建立了新的最佳性能。