图像序列的成对分解用于主动多视角识别

May, 2016

图像序列的成对分解用于主动多视角识别

Pairwise Decomposition of Image Sequences for Active Multi-View Recognition

Edward Johns, Stefan Leutenegger, Andrew J. Davison

TL;DR本文介绍了一种将卷积神经网络应用到多视角识别中的方法，可以有效地解决任意摄像机轨迹上的识别问题，并且在ModelNet数据集上取得了最先进的结果。同时，该方法也可以在活动识别中应用。

Abstract

A multi-view image sequence provides a much richer capacity for object recognition than from a single image. However, most existing solutions to multi-view recognition typically adopt hand-crafted, model-based geometric methods, which do not readily embrace recent trends in deep learni

发现论文，激发创造

多视角卷积神经网络用于3D形状识别

本研究论述了通过CNN架构识别单个和多个渲染图像视角的2D视图图集能够在3D物体识别方面表现出更好的性能，提出并证明CNN架构结合多个视角信息可提供更好的识别性能，同样适用于人手绘图的物体识别。

May, 2015

卷积模型用于联合物体分类和姿态估计

本文探讨了深度学习方法在物体识别和姿态估计方面的应用，发现卷积神经网络（CNN）可以同时进行物体分类和姿态估计，并在两个大型多视点数据集上实现了优于最先进方法的表现。

Nov, 2015

构建多任务 CNN 进行视角估计

本文比较了不同的物体类别视点估计方法，并提出一种新的联合训练方法，并强调了分类方法的优越性、深度架构和扩展训练数据的好处，并证明了即使使用ImageNet训练数据，合成数据也是有益的。结合所有这些因素，我们在Pascal3D+数据集上的结果比先前的最新成果提高了约5％的mAVP，特别是在24个视点分类任务上，将结果从31.1％提高到36.1％的mAVP。

Sep, 2016

二阶信息对大规模视觉识别有用吗？

该论文提出了一种基于高级特征的协方差汇集方法，即Matrix Power Normalized Covariance (MPN-COV)，并在ImageNet上的测试中表现出了显著的成果，特别是在AlexNet，VGG-M和VGG-16的情况下，MPN-COV方法可以使性能提高超过3％，并且与ResNet-152相媲美。

Mar, 2017

多视角多类别物体姿态估计的统一框架

本文介绍了一种基于深度卷积神经网络的方法，能够通过对特定对象类的分类和姿态回归，从单个或多视图中准确地推断大量对象类的六自由度姿态，并通过SE（3）的均匀镶嵌提高了鲁棒性。作者还提出了一种适用于单视角存在歧义的高效多视图框架，并在YCB-Video、JHUScene-50和ObjectNet-3D三个大规模基准测试中取得了优异的表现，与目前现有技术相比表现优秀。

Mar, 2018

等变多视角网络

本文提出了一种基于群卷积的多视图融合方法，实现对所有视图的联合推理，并通过对旋转群的离散子群进行卷积来维持等变性，从而在多个大规模的3D形状检索任务中取得了新的最高水平，并且在全景场景分类方面也有额外的应用。

Apr, 2019

跨域对象姿态估计的多路径学习

提出了一种可扩展的对象姿态估计方法，使用多个三维模型的模拟 RGB 视图进行训练，并使用所谓的“多路径学习”技术，涉及共享编码器和不同解码器，从而实现对不同实例的通用编码器的训练。在多个数据集上实现了最先进的 6D 目标检测结果。

Aug, 2019

MVTN：用于三维形状识别的多视角转换网络

本文介绍了一种基于多角度变换的深度学习网络架构，通过改变视角，以使得机器在3D形状识别任务中取得更好的性能。该网络框架在静态视角方法的基础上，实现了自适应动态视角模式，将深度学习与可微渲染技术相结合，并在三个公开数据集上取得了较高的识别精度。

Nov, 2020

多视角三维物体识别的深度模型综述

综述了基于多视图三维物体识别方法在三维分类和检索任务方面的最新进展，聚焦于基于深度学习和基于Transformer技术的方法，包括常用的三维数据集、相机配置和视角数量、视角选择策略、预训练卷积神经网络架构、融合策略以及在三维分类和检索任务上的识别性能，同时考察了多视图分类在计算机视觉应用中的各种情况，并凸显了关键发现和未来发展方向。

Apr, 2024

超越视角：通过联合多部分表示实现任意视角下的稳健三维物体识别

本研究介绍了一种新颖的基于部件的网络(PANet)，用于解决在任意视角下的3D物体识别问题，并在基准数据集上实验证明其优于现有的基于视点聚合的基准方法，甚至超过了大多数固定视点方法。

Jul, 2024