Aug, 2023

CVPR2023 BURST 长尾和开放世界挑战的第一名解决方案

TL;DR目前,视频实例分割(VIS)旨在从训练类别的有限集中对视频中的对象进行分割和分类,但缺乏处理真实世界视频中多样对象的能力。本研究在长尾和开放世界场景下研究了 VIS,通过训练模型在 LVISv0.5 和 COCO 数据集上,并在 TAO 数据集上训练实例外观相似性模块,实现了对稀有对象的检测和跟踪,在 BURST 测试集上取得了显著的性能。