- 基于光流和伪深度图的密集单目运动分割:一种零样本方法
我们提出了一种创新的混合方法,既利用深度学习方法又利用基于光流的传统方法来进行密集运动分割,而无需进行任何训练。
- 无监督神经形态空中监视运动分割
通过在事件数据和光流信息上利用自监督变换器,我们提出的方法克服了事件驱动运动分割的限制,消除了人工注释的需求,并减少了参数调整问题,实现了在多个数据集上与现有方法相比的最新性能,适用于高动态航空平台上的高清事件摄像头在城市环境中处理各种类型 - 学习如何从未标记的视频中检测和分割移动对象
我们提出了仅从未标记视频中学习的 Mobile Object Detector(MOD-UV),它可以在单张静态图像中检测和分割移动对象,并且在 Waymo Open、nuScenes 和 KITTI 数据集上实现了最先进的无监督移动对象检 - CVPR融合深度学习与几何运动模型的野外零样本单眼运动分割
通过使用深度学习和几何模型融合方法,在无需训练数据的情况下,我们提出了一种能够在移动单目摄像机中以零样本方式实现优秀的运动分割结果的新型单目密集分割方法,并通过实验证明了几何模型融合对于运动分割的有效性。
- 运动物体分割:只需 SAM(和 Flow)
通过将光流与 Segment Anything 模型 (SAM) 结合,本文研究了两种模型,一种使用光流作为输入,另一种使用 RGB 作为输入,这两种简单的方法在单个和多个物体分割基准测试中,凭借其出色的性能超过了所有先前的方法,同时还将这 - 室外场景:面向复杂场景的动态事件分割的普适化
本文介绍了一种基于事件相机的运动分割方法,可以成功应用于复杂的大规模室外环境,采用创新的分而治之流程结合状态理解模块和光流模块,以及基于 Transformer 的时间关注模块进行运动分割,在经典的室内 EV-IMO 基准测试和基于 DSE - 基于谱聚类的运动分割统一模型选择技术
该论文提出了一种统一的模型选择技术,通过结合不同的现有模型选择技术,自动推断用于基于谱聚类的运动分割方法的运动组数,并在 KT3DMoSeg 数据集上评估了该方法在给定簇数为基准信息时与基准方法相比所取得的有竞争力的结果。
- 自动驾驶的 WoodScape 运动分割 --CVPR 2023 OmniCV 研讨会挑战
本研究通过分析自动驾驶中的运动分割挑战和基于鱼眼镜头的数据集,探索和评估合成数据在此领域的潜力和影响,并提供有关基线实验和获胜方法的详细分析及结果。
- Dynamo-Depth:修复动态场景的无监督深度估计
Dynamo-Depth 是一种基于未标记单目视频筛选的三维独立光流场和运动分割的联合学习的方法,通过解决动态场景下深度估计的不确定性问题,实现了在 Waymo Open 和 nuScenes 数据集上单目深度估计的最新成果,特别在移动物体 - 一次性进行的无监督运动分割:对视频进行平滑长期建模
提出了一种基于长期时空模型的运动分割方法,该方法通过处理光流场序列,以无监督学习的方式提供视频中一致运动的分段,为计算机视觉任务和无监督视频表示学习提供了先决条件。
- 移动单目相机的运动分割
本研究讨论了利用点轨迹和光流等方法相互融合,在移动的单目摄像头中识别和分割运动物体,实现对复杂场景中不同对象运动的模拟,最终取得了最先进的效果。
- 动态物体的联合自监督深度和光流估计
本研究提出了一种基于深度学习的深度估计方法,通过将光流信息与深度估计相结合,在预测不同运动情况下的深度时减小像素包裹误差和光学向量,利用自我监督深度估计方法对不同运动区域进行独立估计并组合为完整的深度,能够比 KITTI Depth 数据集 - LiDAR-BEVMTN:用于自动驾驶的实时激光雷达鸟瞰式多任务感知网络
LiDAR 在自动驾驶中具有重要作用,本文提出了一种基于 LiDAR 的实时多任务卷积神经网络,用于对象检测、语义分割和运动分割,并在汽车级嵌入式平台上实现了 3ms 延迟,取得了语义分割和运动分割的最新成果以及 3D 物体检测的接近最新成 - 分离关注力:具有上下文语境的无监督多物体发现
本文介绍了一种无监督学习方法,通过将视觉场景分割为独立运动区域并生成多模式表示,来实现多物体运动分割。该方法基于 Slot Attention 进行生成对抗网络设计,其优于最近的无监督多物体分割方法,同时速度快且不需要显式正则化。
- 量子运动分割
本文介绍了一种基于绝热量子优化的运动分割算法,它在可映射到现代量子退火器的问题实例上达到了与现有技术相当的性能。
- CVPR发现可移动的物体
本文针对对象发现这一问题,通过选择动态对象并使用自编码器提取图像特征并加入来自运动分割的弱学习信号,成功地从复杂场景中分离出运动和静止的动态对象,相较于其它抽象特征的方法在 KITTI 数据集上有更好的表现。
- 基于 EM 算法的非监督学习在高效运动分割中的应用
本文提出了一种基于卷积神经网络 (CNN) 的完全无监督的运动分割方法,借鉴了期望最大化算法 (EM) 框架用于设计不需要地面真值或手动标注的运动分割神经网络的损失函数和训练过程,能够通过单一推断步骤为任何看不见的光流场提供分割,并能有效地 - CVPR通过运动分组的自监督视频目标分割
本研究介绍了一种基于运动线索的分割方法,使用 Transformer 网络结构,采用自我监督的方法进行训练,结果在公共基准测试中表现优异,证明在现有视频分割模型中,对于运动线索的重要性,以及对视觉外观存在潜在偏差的可能性。
- CVPRSSTVOS: 稀疏时空 Transformer 用于视频物体分割
介绍了一种基于 Transformer 的视频对象分割方法,称为 Sparse Spatiotemporal Transformers (SST),使用稀疏注意力抽取每个对象的每个像素表示,同时具有解决运动分割所需的对应关系计算的归纳偏差。 - MultiBodySync: 通过 3D 扫描同步实现多体分割和运动估计
提出了 MultiBodySync,一个新颖的、端到端可训练的多体运动分割和刚体配准框架,利用光谱同步和迭代深度声明网络解决多扫描多体情形下的运动分割和匹配问题,实现了在不同对象类别上的强泛化能力。