BriefGPT.xyz
大模型
Ask
alpha
关键词
pixel-level video understanding
搜索结果 - 3
复杂视频理解的 PVUW 2024 挑战:方法与结果
复杂环境下像素级视频理解的挑战,提供了基于 MOSE 数据集的复杂视频对象分割以及基于 MeViS 数据集的运动表达引导的视频分割两个新的跟踪,并通过提供具有挑战性元素的额外视频和注释来促进像素级视频场景的综合和强大的理解。
PDF
10 days ago
2024 年野外像素级视频理解竞赛(CVPR'24 PVUW)中视频全景分割优胜者,以及视频语义分割最佳长视频一致性
该研究论文详细介绍了我们在 PVUW'24 VPS 挑战中获得第一名的研究工作,以及在 PVUW'24 VSS 挑战中获得第三名的研究工作,该方案基于 DINOv2 ViT-g 视觉转换模型和多阶段分离的视频实例分割 (DVIS) 框架。
PDF
a month ago
基于遮罩视频一致性的 VSPW 数据集语义分割
我们提出了基于现有模型的基于蒙版视频一致性 (MVC) 的解决方案,通过在预测过程中强制保持遮挡帧之间的一致性来学习蒙版部分的分割结果和视频的前后帧之间的关系,同时采用测试时增强、模型聚合和多模态模型后处理方法,该方法在 VSPW 数据集上
→
PDF
a month ago
Prev
Next