- 大规模 LiDAR 点云中精确实例分割的研究
研究通过聚类策略和点嵌入来改进全景分割的实例分割步骤,以解决同一个语义类别附近实例分割的挑战,实验证明该策略的有效性和多样性。
- ReMaX: 针对高效全景分割的放松优化训练
本文提出一种 ReMaX 的新机制,通过在学习时添加对分割蒙版和类别蒙版的松弛约束,可以实现更高效的全景分割,使其更易于部署,同时可以与 MobileNetV3-Small 等高效 backbones 结合使用,从而在 COCO、ADE20 - PANet: 稀疏实例提议和聚合的 LiDAR 全景分割
本篇论文提出了名为 PANet 的新型 LiDAR 宽景分割 (LPS) 框架,采用便于生成稀疏种子点的平衡采样,泡沫位移和连通组件标签算法直接将物点分组形成实例,通过实例聚合模块来提高大型物体的 LPS 性能。与其他文献相比,在 Sema - 改进基于全景的夜间或低光城市驾驶场景分割
该论文提出了一种基于域转换方法的实用且高效的新型 Panoptic Segmentation 技术,以提高自动驾驶系统在夜间或光照不良环境下的性能和鲁棒性。
- CVPR通用零样本分割的原始生成和语义相关对齐
本文研究了通用的零样本分割,该方法能够通过将语义空间中的跨类关系应用于视觉特征学习,从而实现新类别的全景、实例和语义分割。我们提出了一种生成模型,在无可见训练数据的情况下,为看不见的类别合成特征,进而实现了在零样本下的全景、实例和语义分割, - PanoOcc:面向基于相机的三维全景分割的统一占据表示
本文介绍了一种名为 PanoOcc 的方法,它是一个基于相机的 3D 全景分割方法,它使用体素查询来聚合来自多帧和多视角图像的时空信息,并将特征学习和场景表示集成到一种全面的占用表示中,用于摄像机 3D 场景理解的统一占用表示,从而实现了更 - RGB-D 变换器实现多任务场景分析
介绍了一种高效的多任务场景分析方法 ——EMSAFormer,使用基于 RGB-D Transformer 的编码器同时执行分割、定位等多项任务,在移动平台上获得最新的性能表现和速度。
- DFormer: 拓扑扩散引导的 Transformer 用于通用图像分割
本文介绍了一种名为 DFormer 的方法,用于实现全局图像分割,该方法将全局图像分割任务视为使用扩散模型的降噪过程,在地面真实掩模上添加各个层次的高斯噪声,然后学习模型从损坏掩模中预测降噪掩模,最后使用基于扩散的解码器逐渐执行掩模预测,并 - 卫星影像时间序列编码的重新思考
通过将卫星图像时间序列处理作为直接的集合预测问题,将其表示学习过程分解为三个明确步骤:集合 - 更新 - 分散,使我们的模型在 PASTIS 数据集上取得了新的最先进结果,比如 U-TAE 等自定义神经结构。此外,通过将时间和空间组件在可视 - RT-K-Net:重新审视 K-Net 实现实时全景分割
本文提出了新的改进 K-Net 结构的方法,以实现实时全景分割,达到了 60.2% 的最新性能表现。
- EDAPS: 增强型域自适应全景分割
本文介绍了一种全新的网络架构 EDAPS,它使用共享的、domain-robust 转换器编码器,以方便语义特征和实例特征的联合适应,但还针对域适应的语义和实例分割任务的特定要求设计了任务特定的解码器,从而显著提高了挑战性 panoptic - 移动地图点云中的全景分割综述
本文旨在针对户外移动映射数据的全景分割问题,建立一个模块化的全局视点分割流水线,通过全面的系统实验来评估全景分割的状态,并提供首个公共数据集。
- Panoptic 分割的实例网络和语义分割集成
本文提出了解决 2019 年 COCO 全景分割任务的方法,结合了实例分割和语义分割,采用多种模型和策略,获取了最佳结果 $PQ$ 47.1。
- ProPanDL: 一种用于不确定性感知全景分割的模块化架构
ProPanDL 是一种能够进行不确定性感知的全景分割网络家族,能够估计全景分割的语义和空间因素的完整概率分布,通过采用样本网络和方差网络进行像素级别的空间不确定性的估计以及采用温度缩放和证据深度学习等方法进行语义不确定性的估计来提高不确定 - 实例神经辐射场
这篇论文介绍了一种名为 Instance NeRF 的学习型 NeRF 3D 实例分割管道,它采用 3D 提案基于掩膜预测网络,可以学习给定场景的 3D 实例分割,并在任意 3D 点查询实例信息,超越了以前的 NeRF 分割方法和具有竞争力 - 深度学习全景分割中的不确定性估计
探讨如何将集成学习不确定性估计方法应用于全景分割领域,以提高现有网络的性能并为其预测结果提供更好的不确定性度量。
- FinnWoodlands 数据集
介绍了一个名为 FinnWoodlands 的森林数据集,包含着 RGB 立体图像、点云、稀疏深度图以及针对于语义、实例和全景分割的地面真实手动注释。同时提出了使用该数据集进行实例分割、全景分割和深度完成的挑战。
- CVPR一次分割,实时全景分割的探索
提出了实时全景分割框架 YOSO,通过动态卷积预测掩模,采用特征金字塔汇聚器进行特征图提取,并采用可分离动态解码器进行全景核生成,具有较高的效率和精度,是首个能够与最先进模型相媲美的实时全景分割框架。
- CVPR采用文本到图像扩散模型的开放词汇全景分割
ODISE 通过联合预训练的文本 - 图像推理和判别式模型实现开放式语料库全景分割,其能力高于现有技术水平,并能在 AED20K 数据集上达到 30.0 mIoU 和 23.4 PQ 的表现。
- AAAI点云统一全景分割
本文提出了一个简单、高效的基于点云的全景分割框架 (PUPS), 使用一组点级分类器以端到端的方式直接预测语义和实例分组。通过将二分图标准添加到训练管道中,并使用 Transformer 解码器进行迭代优化,PUPS 实现了更好的分组结果,