CVPRApr, 2022

视频实例分割的时间高效视觉 Transformer

TL;DR提出了一种名为 TeViT 的视觉 Transformer,它在视频实例分割任务中高效地对关键的时间信息进行建模,并在三个广泛采用的视觉实例分割基准测试中取得了最新的结果。