图像序列的成对分解用于主动多视角识别
本研究论述了通过CNN架构识别单个和多个渲染图像视角的2D视图图集能够在3D物体识别方面表现出更好的性能,提出并证明CNN架构结合多个视角信息可提供更好的识别性能,同样适用于人手绘图的物体识别。
May, 2015
本文探讨了深度学习方法在物体识别和姿态估计方面的应用,发现卷积神经网络(CNN)可以同时进行物体分类和姿态估计,并在两个大型多视点数据集上实现了优于最先进方法的表现。
Nov, 2015
本文比较了不同的物体类别视点估计方法,并提出一种新的联合训练方法,并强调了分类方法的优越性、深度架构和扩展训练数据的好处,并证明了即使使用ImageNet训练数据,合成数据也是有益的。结合所有这些因素,我们在Pascal3D+数据集上的结果比先前的最新成果提高了约5%的mAVP,特别是在24个视点分类任务上,将结果从31.1%提高到36.1%的mAVP。
Sep, 2016
该论文提出了一种基于高级特征的协方差汇集方法,即Matrix Power Normalized Covariance (MPN-COV),并在ImageNet上的测试中表现出了显著的成果,特别是在AlexNet,VGG-M和VGG-16的情况下,MPN-COV方法可以使性能提高超过3%,并且与ResNet-152相媲美。
Mar, 2017
本文介绍了一种基于深度卷积神经网络的方法,能够通过对特定对象类的分类和姿态回归,从单个或多视图中准确地推断大量对象类的六自由度姿态,并通过SE(3)的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架,并在YCB-Video、JHUScene-50和ObjectNet-3D三个大规模基准测试中取得了优异的表现,与目前现有技术相比表现优秀。
Mar, 2018
本文提出了一种基于群卷积的多视图融合方法,实现对所有视图的联合推理,并通过对旋转群的离散子群进行卷积来维持等变性,从而在多个大规模的3D形状检索任务中取得了新的最高水平,并且在全景场景分类方面也有额外的应用。
Apr, 2019
提出了一种可扩展的对象姿态估计方法,使用多个三维模型的模拟 RGB 视图进行训练,并使用所谓的“多路径学习”技术,涉及共享编码器和不同解码器,从而实现对不同实例的通用编码器的训练。在多个数据集上实现了最先进的 6D 目标检测结果。
Aug, 2019
本文介绍了一种基于多角度变换的深度学习网络架构,通过改变视角,以使得机器在3D形状识别任务中取得更好的性能。该网络框架在静态视角方法的基础上,实现了自适应动态视角模式,将深度学习与可微渲染技术相结合,并在三个公开数据集上取得了较高的识别精度。
Nov, 2020
综述了基于多视图三维物体识别方法在三维分类和检索任务方面的最新进展,聚焦于基于深度学习和基于Transformer技术的方法,包括常用的三维数据集、相机配置和视角数量、视角选择策略、预训练卷积神经网络架构、融合策略以及在三维分类和检索任务上的识别性能,同时考察了多视图分类在计算机视觉应用中的各种情况,并凸显了关键发现和未来发展方向。
Apr, 2024
本研究介绍了一种新颖的基于部件的网络(PANet),用于解决在任意视角下的3D物体识别问题,并在基准数据集上实验证明其优于现有的基于视点聚合的基准方法,甚至超过了大多数固定视点方法。
Jul, 2024