STD2P: 利用时空数据驱动池化进行 RGBD 语义分割

CVPRApr, 2016

STD2P: 利用时空数据驱动池化进行 RGBD 语义分割

STD2P: RGBD Semantic Segmentation Using Spatio-Temporal Data-Driven Pooling

Yang He, Wei-Chen Chiu, Margret Keuper, Mario Fritz

TL;DR提出了一种新颖的基于超像素的多视角卷积神经网络，通过利用同一场景的其他视角信息生成单个图像的高质量分割，并且利用光流和基于图像边界的超像素计算区域对应关系，提出了一种新颖的时空池化层对空间和时间信息进行聚合，实现对图像的分割。经过对 NYU-Depth-V2 数据集和 SUN3D 数据集的评估，与各种单视图和多视图方法相比，不仅有严格的改进，同时也表明在多视图和单视图预测时利用标记帧的好处。

Abstract

We propose a novel superpixel-based multi-view convolutional neural network for →

superpixel-based multi-view convolutional neural network semantic image segmentation optical flow

发现论文，激发创造

使用 RGB-D 相机的多视角深度学习实现一致的语义映射

本文提出一种从多个 RGB-D 视图中进行对象类语义分割的新方法，使用深度学习训练神经网络进行预测，同时借助于 RGB-D 的 SLAM 获取摄像机轨迹，实现多视图一致性训练和测试。实验结果表明，与单视图基准线相比，深度特征池化和多视角融合可以在 NYUDv2 数据集上实现单视图语义分割和多视图语义融合的最新性能。

Mar, 2017

室内语义分割使用深度信息

采用多尺度卷积神经网络直接从图像和深度信息中学习特征实现室内场景的多类别分割，并在 NYU-v2 深度数据集上取得了 64.5% 的准确率，充分说明了适当的硬件（如 FPGA）可以实现实时处理。

Jan, 2013

深度语义分割的三重审视：注重效率、时间性和深度感知的设计

本文针对自主行驶场景下的语义分割问题进行了调研，从模型开发、RGB-D 数据集集成、时域信息模型三个方面讨论了目前最相关和最新的深度学习方法，旨在为读者提供关于这一激动人心和具有挑战性的研究领域的最新进展。

Mar, 2023

ALSTER：一种用于在线 3D 语义重建的本地时空专家

我们提出了一种在线的三维语义分割方法，可以从连续的 RGB-D 帧流中增量重建三维语义地图，适用于具有实时约束的场景，例如机器人技术或混合现实。我们的方法通过联合估计每帧的几何和语义标签来有效提取输入 RGB-D 视频流的信息，并利用 2D 输入和局部 3D 领域的差异进行对语义实体的推理，进而预测场景的增量更新并整合到全局场景表示中，实验结果表明我们的方法相对于现有的在线方法在本地区域产生了改进，并且展示了互补信息可以提升性能的证据。

Nov, 2023

从视频学习时空一致性以提高语义分割

利用无监督学习深度、自我运动和相机内在参数，通过在视频帧之间施加三维几何和时间一致性，从而提高单图像语义分割性能。

Apr, 2020

面向高效 RGB-D 语义分割的空间信息引导自适应上下文感知网络

提出了一种有效的轻量级编码器 - 解码器网络以及其他相关模块，用于在移动机器人中进行 RGB-D 语义分割，通过跨模态相关性和补充线索可以准确提取多层次 RGB-D 特征，实验结果表明该方法在分割准确性、推理时间和参数方面具有更好的权衡。

Aug, 2023

通过对比损失和多数据集训练方法在 VSPW 数据集上进行语义分割

本文针对视频语义分割问题，探究利用对比损失增强时空相关性，以及多数据集训练对模型的影响，并将两种模型的输出进行聚合，最终在 VSPW 数据集上达到了 65.95% mIoU 的性能，在 CVPR 2023 的 VSPW 挑战上取得了第一名。

Jun, 2023

室内场景实时渐进式 3D 语义分割

本文提出了一种高效而健壮的技术，实现了 3D 室内场景的即时密集语义分割和重建，该方法基于高效的超体素聚类方法和来自结构和对象线索的高阶约束的条件随机场，无需预先计算即可进行渐进式密集语义分割。通过对 SceneNN 和 ScanNet 数据集中的不同室内场景进行广泛评估，证明了该技术在定性和定量实验中始终能够产生最先进的分割结果。

Apr, 2018

基于超像素的统计过程控制训练的语义分割

通过基于超像素采样的方法和使用统计过程控制的梯度来训练和测试，该论文提出了一种在 Pascal Context，SUN-RGBD 数据集上性能优于或等于传统方法的语义分割网络，减少了上采样运算的复杂度。

Jun, 2017

基于空间信息引导的卷积神经网络实现实时 RGBD 语义分割

提出 Spatial information guided Convolution（简称 S-Conv）算法，将 RGB 特征与 3D 空间信息高效地集成，不会严重影响实时应用，可用于语义分割任务，实现出色的性能，并在 NYUDv2 和 SUNRGBD 数据集上获得最先进的性能。

Apr, 2020