SOGNet: 面向全景分割的场景重叠图网络
介绍了一项新的问题任务,即基于全景分割生成全景场景图(PSG);创建了一个高质量 PSG 数据集用于基准测试,并介绍了四种传统方法的改进和两种基于 Transformer 的单阶段基线;探讨了未来的挑战和发展方向。
Jul, 2022
该论文提出了一种新型的端对端网络,能够高效地预测实例和物体分割,并引入了一种新的空间排名模块以处理预测实例之间的遮挡问题。在 COCO Panoptic 基准测试上取得了可喜的成果。
Mar, 2019
本文提出了一种高效的基于 LiDAR 的全景分割框架 GP-S3Net,通过构建图卷积网络以识别物体并将其与背景类融合,利用实例标签为构造的每个图生成地面真实边缘标签来监督学习,在 nuScenes 和 SemanticPOSS 等数据集上实验表明 GP-S3Net 优于现有最先进的方法,在公共 SemanticKITTI 排行榜上排名第一。
Aug, 2021
通过在传统的全景分割网络中引入图形结构来挖掘前景物体和背景物体类别内的模块内部和模块间关系,进而建立单一的 end-to-end 网络,以实现对图像的整体理解。该模型 (BGRNet) 在 COCO 和 ADE20K 全景分割基准中实现了新的最先进性能。
Apr, 2020
本文提出了一种名为 OCFusion 的轻量级方法来解决 Panoptic 分割中目标实例之间的重叠问题,该方法通过二元关联建模来实现物体实例的非重叠分割。该方法利用现有数据集注释自动推导出的真实关联进行训练,在 COCO 数据集上表现出最先进的效果,并在 Cityscapes panoptic 分割基准测试中展示了竞争力的结果。
Jun, 2019
本文提出了一种基于 Pair Proposal Network (PPN) 的新型架构 Pair then Relation (Pair-Net),利用矩阵学习器 (matrix learner) 来过滤稀疏的主语和宾语之间的关系,通过实验分析得到了新的最佳 PSG 表现结果,并超越了之前的 PSGFormer。
Jul, 2023
从场景的 RGB-D 图像中,我们提出了一种零样本全景重建方法,该方法利用开放词汇实例分割并利用密集广义特征传播部分标签和构建 3D 实例图进行关联来解决场景的全景分割和实例关联挑战。
Jul, 2024
本文提出了一种基于双向学习流程和插拔式遮挡处理算法的深度全景分割方案,用于同时执行前景实例的实例分割和背景物品的语义分割,并能有效地处理不同物体实例之间的遮挡问题。在 COCO 全景基准测试中,实验结果验证了我们所提出的方法的有效性。
Mar, 2020
该论文提出了第一个像素级分割 - 基于场景图生成的框架,并通过辅助数据集的转移学习和多任务学习解决了目标场景图数据集中缺乏分割标注的问题,其中引入了基于语义相似性权重的线性组合来表达目标对象的分割掩模,并引入了新颖的高斯注意机制实现像素级关系预测,并且该框架支持端到端可训练。
Apr, 2021