学习时间分布和空间相关性用于通用移动目标分割

Apr, 2023

学习时间分布和空间相关性用于通用移动目标分割

Learning Temporal Distribution and Spatial Correlation for Universal Moving Object Segmentation

Guanfang Dong, Chenqiu Zhao, Xichen Pan, Anup Basu

TL;DR本文提出了一种称为学习时空分布和空间相关性的方法，它的能量可以作为普适的解决方案来完成所有类型的自然场景下的运动目标分割，通过在分布学习中引入深度学习网络和在空间相关性中引入随机贝叶斯细化网络的方法，从而大大改善了分割的效果。

Abstract

Universal moving object segmentation aims to provide a general model for videos from all types of natural scenes, as previous approaches are usually effective for specific or similar scenes. In this paper, we propose a method called Learning →

moving object segmentation universal model spatial correlation temporal distribution deep learning networks

发现论文，激发创造

学习关注焦点以实现高效视频目标检测

提出了一种基于可学习的空间 - 时间采样 (LSTS) 模块、分散递归特征更新 (SRFU) 和密集特征聚合 (DFA) 模块，实现了视频目标检测中的准确空间对应关系，增强特征更新，提升检测性能，并在 ImageNet VID 数据集上取得了最先进的表现和实时速度。

Nov, 2019

学习移动物体的分割

本文提出了一种基于神经网络的视频分割方法，用于区分视频帧中独立运动的物体，并利用对象运动、外观和时间一致性等多个信息源，通过对数据进行训练得到模型，经过评估表明该模型在 DAVIS、Freiburg-Berkeley 运动分割数据集和 SegTrack 等数据集上表现良好。

Dec, 2017

实现移动物体的分割

通过光流作为解释运动信号的底层信号，将移动信息与外观信息相结合，提出一种基于学习的 Spatio-Temporal Grouping 方法，成功地应用于封闭前景物体个体的分割的问题。

Feb, 2019

视频目标分割的时空多层关联

该研究提出了一种空间 - 时间多层次关联框架，以解决现有半监督视频对象分割方法在空间特征匹配和时空特征建模方面的限制，并通过空间 - 时间记忆库实现充分的目标交互和高效的并行处理，从而提高视频对象分割的效果。

Apr, 2024

基于相关性学习的多目标跟踪

本文提出了基于局部相关性模块的密集对应和可学习相关算子来增强模型的判别能力和对时间上下文的捕捉能力，从而在多目标跟踪方面取得了最先进的效果，并在 MOT17 数据集上实现了 76.5% 的 MOTA 和 73.6% 的 IDF1。

Apr, 2021

针对无监督视频多物体分割的目标感知对象发现和关联

该研究提出了一种新颖的无监督视频多目标分割方法，通过结合前景区域估计和实例分组来提高实例判别，引入判别性外观模型用于目标跟踪，实现更准确的物体发现，以及采用自适应内存更新等三种策略提高分割准确性和推理速度，并在 DAVIS17 和 YouTube-VIS 数据集上超越了现有技术的表现。

Apr, 2021

指代视频对象分割的时态采集与分发

视频对象分割通过自然语言表达对视频序列中的参照物进行分割，提出了同时维护全局参照标记和一系列对象查询的方法，以实现对对象在帧级别的定位和分割，进而利用新颖的时间采集 - 分布机制来捕捉对象动态并进行时空交叉模态推理，实验结果表明，该方法在所有基准测试中始终显著优于最先进的方法。

Sep, 2023

利用动态显著性引导的时空传播进行无监督视频目标分割

本文提出了基于光流和边缘线索的新型显着性估计技术和新型邻域图，用于解决快速运动，运动模糊和遮挡等视频分割的挑战，在 DAVIS，SegTrack v2 和 FBMS-59 数据集中取得了超越深度学习方法的最新成果。

Sep, 2018

高效长短时注意力网络用于无监督视频目标分割

无监督视频对象分割（VOS）旨在识别视频中主要前景对象的轮廓，但以往的方法没有充分利用时空上下文，并且无法在实时中处理这一具有挑战性的任务。因此，本文提出了一种高效的长短时序注意力网络（LSTA），从整体视角解决了无监督 VOS 任务。该网络由长时序记忆和短时序注意力两个主要模块组成，前者通过编码外观模式来捕获过去帧和当前帧的长期全局像素关系，后者通过编码动态模式来揭示附近帧和当前帧的短期局部像素关系。为了加快推理速度，采用了高效投影和基于局部性的滑动窗口，分别实现了两个轻量级模块的几乎线性时间复杂度。在几个基准测试中进行了大量实证研究，证明了所提方法具有高效的有希望的性能。

Sep, 2023

一种面向交通应用的无监督 LiDAR 分割的时空对应方法

我们解决了在各种交通场景下，对室外 LiDAR 点云进行无监督语义分割的问题，通过建立多帧之间的时空对应关系，将点云序列的时空特征引入强化扩充，融合聚类和伪标签学习，以无监督的学习方式学习辨别特征，展现出在自动驾驶车辆和交叉口基础设施方面的分割性能在 Semantic-KITTI，SemanticPOSS 和 FLORIDA 基准数据集上表现得很有竞争力，该通用框架可以为 LiDAR 点云的统一表示学习方法融入领域知识。

Aug, 2023