稀疏 3D 卷积神经网络
使用 4D 卷积神经网络,通过稀疏张量和广义稀疏卷积提供的广泛高维函数,实现了针对 3D 视频的时空感知,并通过提出的混合核和三边静态条件随机场,优化了 7D 时空色度空间中的一致性问题。实验表明,与 2D 或 2D-3D 混合方法相比,只使用广义 3D 稀疏卷积的卷积神经网络可以获得更好的性能。此外,我们还表明,在处理 3D 视频时,4D 时空卷积神经网络不仅更加鲁棒,而且有时比 3D 卷积神经网络更快。
Apr, 2019
我们提出了一种新的卷积神经网络实现,针对稀疏的 3D 数据推理进行了优化。该实现使用 NanoVDB 作为数据结构来存储稀疏张量,在保持高性能的同时占用相对较小的内存。我们证明,该架构在高分辨率 3D 目标分类网络上的速度大约比最先进的密集卷积神经网络模型快 20 倍。
Nov, 2023
本研究提出了一种新的稀疏卷积操作,旨在更高效地处理空间稀疏数据,并使用其开发出空间稀疏卷积网络 (SSCNs)。我们在涉及三维点云的语义分割任务中展示了这种模型的强大性能,特别是我们的模型在最近一个语义分割竞赛的测试集上超越了所有以前的最新技术。
Nov, 2017
该论文评估了 S3DCNN 在大规模 3D 形状基准 ModelNet40 上的性能,并衡量其受输入形状体素分辨率的影响,证明其在训练和推理阶段的计算成本要低得多,并提出了高分辨率输入的好处可能会受到神经网络推广高级特征能力的限制。
Nov, 2016
近年来,深度学习方法的利用显著增加,尤其是卷积神经网络(CNNs),已成为涉及结构化网格数据的各个领域,如图片分析和处理中的主要方法。然而,在许多领域中,激光雷达和 3D 传感器的指数增长导致了对 3D 点云分析的增加需求。与照片不同,点云呈现稀疏性且缺乏规则网格,因此存在着不同的处理和计算问题,这对于包括物体识别在内的各种应用非常关键。
Feb, 2024
通过在大规模监督视频数据集上使用训练的深度三维卷积神经网络(3D ConvNets)提出了一种简单而有效的时空特征学习方法。我们的成果有三个:1)相对于 2D ConvNets,3D ConvNets 更适用于时空特征学习;2)所有层中具有小的 3x3x3 卷积核的同构体系结构是 3D ConvNets 中表现最佳的体系结构之一;3)我们学到的特征 —— 即 C3D(卷积 3D)—— 连同一个简单的线性分类器,在 4 个不同的基准测试中优于最先进的方法,并与其他 2 个基准测试中的最佳方法相当。此外,这些特征紧凑:只需 10 维便能在 UCF101 数据集上达到 52.8%的准确率,由于 ConvNets 的快速推理,计算效率也非常高。最后,它们在概念上非常简单易用且易于训练和使用。
Dec, 2014
通过处理空间稀疏的输入,我们开发了一种 CNN,可更加高效地训练和测试大型深度 CNN,在手写识别和图像分类等问题上取得了良好的性能。该方法在 CASIA-OLHWDB1.1 和 CIFAR-10/CIFAR-100 数据集上实现了较低的测试误差率。
Sep, 2014
本文介绍了一个使用 3D 点云进行语义分割和对象识别的卷积神经网络,其中核心是点卷积,这是一种可以在点云的每个点上应用的新型卷积算子,并且网络设计简单且能在语义分割和对象识别任务中获得可比较的准确性。
Dec, 2017
本文研究了如何将现有的资源有效的 2D 卷积神经网络转换为 3D 卷积神经网络,并测试了它们在不同复杂度水平下的性能和实时性能,结果表明这些模型可以应用于各种实际应用程序,提供了可观的准确性和内存使用。
Apr, 2019