iSPA-Net: 迭代语义姿态对齐网络

MMAug, 2018

iSPA-Net: Iterative Semantic Pose Alignment Network

Jogendra Nath Kundu, Aditya Ganeshan, Rahul M. V., Aditya Prakash, R. Venkatesh Babu

TL;DRiSPA-Net is an iterative Semantic Pose Alignment Network that exploits semantic 3D structural regularity to solve the task of fine-grained pose estimation by predicting viewpoint difference between a given pair of images, and achieves state-of-the-art performance on various real image viewpoint estimation datasets with the aid of correspondence of learned spatial descriptor of the input image pair and refinement in consecutive iterations utilizing an online rendering setup along with effectiveness of a non-uniform bin classification of pose-difference; the approach also shows effectiveness for active object viewpoint localization and unsupervised part-segmentation transfer using only a single part-annotated 3D template model per object class.

Abstract

Understanding and extracting 3D information of objects from monocular 2D images is a fundamental problem in computer vision. In the task of 3D object pose estimation, recent data driven deep neural network based approaches suffer from scarcity of real images with 3D keypoint and pose annotations. Drawing inspiration from human cognition, where the annotators

3d object pose estimation semantic pose alignment network image comparison fine-grained pose estimation non-uniform bin classification

发现论文，激发创造

稀疏多物体渲染与比较

通过引入多目标检测网络，本研究在 CAD 模型、3D 形状、姿势估计领域取得了最先进的表现，提高了实例对齐准确度，与多视角方法相当。

Oct, 2023

SPP-Net：使用合成图像进行深度绝对姿态回归

通过稀疏特征描述符基于深度学习神经网络架构设计实现图像绝对姿态估计问题，取得了 state-of-the-art 的性能表现，同时使用这种方式的优势可以提高模型的效率和扩展性以及泛化性能。

Dec, 2017

VI-Net: 通过学习球面表示上的解耦旋转，提升 6D 目标类别级别的位姿估计

本文通过将旋转分解为视角旋转和平面内旋转的组合，提出了一种名为 VI-Net 的新型旋转估计网络，用于解决 6D 物体姿态估计中高精度的 RGB-D 物体观测的旋转估计难题。通过基于球面的特征学习，在两个不同分支上进行估计，并通过神经网络实现视角旋转和平面内旋转的估计。通过实验证明了该方法在高精度情况下较现有方法的优越性，尤其在无 CAD 模型情况下的类别级 6D 物体姿态估计任务中。

Aug, 2023

单张图像 3D 解释器网络

本文提出了一种名为 3D Interpreter Network（3D-INN）的端到端框架，通过序贯估计 2D 关键点热图和 3D 物体结构，该网络主要依靠两项技术创新，即 Projection Layer 和关键点热图。通过在真实 2D 注释图像和合成 3D 数据上训练，3D-INN 在 2D 关键点估计和 3D 结构恢复上均取得了最先进的性能。

Apr, 2016

SegICP: 深度语义分割与姿态估计

该研究提出了 SegICP，一种用于实现物体识别和位姿估计的新型解决方案，它采用卷积神经网络和多假设点云注册相结合的方法，实现了强大的像素级语义分割和准确的实时六自由度姿势估计，快速提高了机器人系统的感知速度和稳健性。

Mar, 2017

利用神经网络进行非合作汇合的姿态估计

本文介绍了一种用于非合作航天器姿态估计的 Spacecraft Pose Network (SPN) 方法，基于单目视觉，无需手工特征提取和仅使用一张灰度图像即可确定相机与航天器之间的姿态。SPN 方法使用一个卷积神经网络，在检测航天器的 2D 边界框的基础上，用三个分支来求解姿态和位置估计，并生成了 Spacecraft PosE Estimation Dataset (SPEED) 数据集，仅用合成图像训练的 SPN 方法能够在实际相机图像上产生角度级姿态误差和 cm 级位置误差。

Jun, 2019

DeLS-3D: 3D 语义地图的深度定位与分割

该研究提出了一种基于深度学习的统一框架，通过将相机视频、运动传感器（GPS/IMU）和三维语义地图进行传感器融合，以实现自主驾驶、自我定位和场景分类等多个应用领域中场景解析和相机姿态同时处理的目的。研究使用的技术包括渲染技术，使用相机姿态和三维语义地图生成标注地图，并在深度神经网络中进行联合训练，以提高姿态估计精度。该研究表明，相较于单一传感器，传感器融合对于目标跟踪及姿态估计具有更高的鲁棒性和准确性。

May, 2018

端到端弱监督语义对齐

本文提出了一种基于卷积神经网络和不同 iable soft inlier scoring 模块的语义对齐方法，该方法无需繁琐的手工标注就能实现对不同但具有语义相关性的图像进行参数学习，并从几何上一致的对应关系计算对齐质量，达到了基于多个标准基准的语义对齐的最先进表现。

Dec, 2017

单幅 RGB 帧的基于语义关键点的姿态估算

该论文提出了一种从单个 RGB 图像中估计物体连续 6-DoF 姿态的方法，该方法结合了经卷积网络预测的语义关键点和可变形的形状模型，同时采用了半自动数据生成技术来训练可学习组件，在实验中该方法达到了与现有技术相当的结果。

Apr, 2022

P2I-NET：通过对抗学习将相机姿态映射到图像以实现实时室内环境中的新视图合成

基于给定的室内环境中的新 6DoF 相机位姿，研究基于一组参考 RGBD 视图预测该位姿下的视角的难题，并提出了一种条件生成对抗神经网络（P2I-NET）来直接预测给定位姿下的新视角。

Sep, 2023