FusionNet: 使用多种数据表示进行的 3D 物体分类

Jul, 2016

FusionNet: 使用多种数据表示进行的 3D 物体分类

FusionNet: 3D Object Classification Using Multiple Data Representations

Vishakh Hegde, Reza Zadeh

TL;DR利用体素表示法和像素表示法，使用卷积神经网络进行 3D 目标识别。使用新的 V-CNN 架构将两种表示法相结合，获得显著更好的分类器。

Abstract

High-quality 3d object recognition is an important component of many vision and robotics systems. We tackle the object recognition problem using two data representations, to achieve leading results on the Princeton ModelNet challenge. The two representations: 1. →

3d object recognition volumetric representation pixel representation convolutional neural networks volumetric cnn

发现论文，激发创造

用于三维数据物体分类的体积和多视角卷积神经网络

本文围绕三维信息在物体分类中的重要性，通过改进现有的立体卷积神经网络和多视卷积神经网络结构，引入了基于多分辨率过滤的三维多视卷积神经网络，取得了比现有技术更好的分类效果，并提供了相关实验结果和设计思路分析。

Apr, 2016

多层次三维卷积神经网络学习多尺度空间特征

本文提出了一种基于多层体素网格的端到端多级学习方法来解决现有 3D 目标识别中结构化和非结构化数据表示的缺陷，结果表明该方法在节约内存的同时能够实现与密集体素表示相当的目标识别性能。

May, 2018

3D ShapeNets：一种用于体积形状的深度表示

使用卷积深度置信网络将几何 3D 形状表示为 3D 体素网格上的二元变量的概率分布，以实现物体识别和根据 2.5D 深度图形完成 3D 形状恢复等多个方面的任务，利用构建的大规模 3D CAD 模型数据集 - ModelNet 进行训练，可以在各种任务中显著提高性能。

Jun, 2014

利用卷积神经网络进行生成式和判别式体素建模

本文探讨了三维数据表示方式的重要性，使用基于体素的模型来进行形状建模和物体分类，并提出了训练基于体素的变分自编码器、探索潜空间的用户界面和采用深度卷积神经网络实现物体分类的方法。最终在 ModelNet 基准测试中，我们的模型相较于最新技术提升了 51.5% 的物体分类准确率。

Aug, 2016

基于体素的单图像多物体三维检测和重建

该研究提出了一种基于 3D 体素特征的中心点检测方法，其中包括一个有效的粗细重建模块，可从单个 2D 图像中检测和重建多个物体的 3D 位置和形状。

Nov, 2021

V-Net: 用于体积医学影像分割的全卷积神经网络

本文提出了一种基于全卷积神经网络的三维图像分割方法，通过优化 Dice 系数的目标函数，应对前景和背景体素数量极不平衡的情况，并通过数据增强技术提高数据样本的数量和多样性，实验结果表明该方法在肺部三维图像分割任务中取得了较好的性能。

Jun, 2016

VoxelNet：基于点云的三维物体检测的端到端学习

VoxelNet 是一种针对点云图像检测的深度网络，可以将点云分割成等间距的三维体素，并通过新引入的体素特征编码层将每组点转换为统一的特征表示，从而生成描述性的体积表示，并连接 RPN 以生成检测。

Nov, 2017

VR3Dense: 用于三维物体检测和单目密集深度重建的体素表示学习

介绍了一种联合训练 3D 目标检测和单目稠密深度重建神经网络的方法，通过 LiDAR 点云和单个 RGB 图像生成物体姿态预测和密集重建深度，其中 LiDAR 点云被转换为一组体素并使用 3D 卷积层提取特征，通过另一个 2D 卷积神经网络提取相应的 RGB 图像特征，并使用这些组合特征来预测密集深度图。

Apr, 2021

多视角卷积神经网络用于 3D 形状识别

本研究论述了通过 CNN 架构识别单个和多个渲染图像视角的 2D 视图图集能够在 3D 物体识别方面表现出更好的性能，提出并证明 CNN 架构结合多个视角信息可提供更好的识别性能，同样适用于人手绘图的物体识别。

May, 2015

基于体素数据的三维网格模型生成

本研究介绍了一种新的体系结构，可实现直接从三维图像体积转换为三维表面，无需后处理并具有比当前方法更好的准确性，证明其优于最先进的分割方法。

Dec, 2019