Aug, 2023

CVPR2023 BURST长尾和开放世界挑战的第一名解决方案

TL;DR目前,视频实例分割(VIS)旨在从训练类别的有限集中对视频中的对象进行分割和分类,但缺乏处理真实世界视频中多样对象的能力。本研究在长尾和开放世界场景下研究了VIS,通过训练模型在LVISv0.5和COCO数据集上,并在TAO数据集上训练实例外观相似性模块,实现了对稀有对象的检测和跟踪,在BURST测试集上取得了显著的性能。