CVPRApr, 2016

STD2P: 利用时空数据驱动池化进行 RGBD 语义分割

TL;DR提出了一种新颖的基于超像素的多视角卷积神经网络,通过利用同一场景的其他视角信息生成单个图像的高质量分割,并且利用光流和基于图像边界的超像素计算区域对应关系,提出了一种新颖的时空池化层对空间和时间信息进行聚合,实现对图像的分割。经过对 NYU-Depth-V2 数据集和 SUN3D 数据集的评估,与各种单视图和多视图方法相比,不仅有严格的改进,同时也表明在多视图和单视图预测时利用标记帧的好处。