- 基于 RGB-D 室内数据的深度学习三维实例分割
通过将深度学习与 RGB-D 数据相结合,提出了一种用于高效 3D 实例分割的新方法,该方法通过点状渲染模块将 2D 区域卷积神经网络(Mask R-CNN)模型与深度信息集成,可以识别和分割对象的 3D 实例,实验证明该方法对于支持机器人 - 一种噪音统治一切:具有通用扰动的多视角对抗攻击
本研究提出了一种新颖的通用干扰方法,用于生成 3D 物体识别中的强健的多视角对抗样本。与仅限于单个视角的传统攻击不同,我们的方法在多个 2D 图像上操作,为增强模型的可扩展性和鲁棒性提供实用且可扩展的解决方案。这种通用方法将 2D 干扰和类 - 将多视角检测和跟踪提升至鸟瞰视角
利用多视角聚合的优势可以解决多目标跟踪和检测中的遮挡和漏检等挑战。通过将所有视图投影到地面并从鸟瞰视图进行检测分析,最近在多视图检测和 3D 物体识别方面的进展显著提高了性能。本文比较现代的无参数和参数化的升降方法与多视角聚合方法,并提出一 - FSD:快速自监督单一 RGB-D 到分类三维物体
通过多阶段训练管线,我们的方法成功地在实时运行中克服了现有自监督方法在 3D 物体识别方面的限制,并在 NOCS 测试集上的 6D 姿态估计中取得了 16.4% 的绝对改进,同时以接近实时的 5 Hz 速度运行。
- CVPR神经部分先验:学习优化基于部分的 RGB-D 扫描物体完成
提出了利用大规模合成数据集和神经部件先验(NPP)来学习 3D 物体的几何部件先验,该方法能够在测试时对现实世界的扫描 3D 场景进行鲁棒的部件分解,同时适应观察到的真实几何形状,并在由相似几何对象组成的场景中实现全局优化。在 ScanNe - 从点云序列进行离线 3D 物体检测
本文提出了一种使用点云序列数据的离线三维对象检测方法,通过多帧对象检测和新颖的对象中心细化模型利用时间点,实现了高质量的自动化三维对象标注,比当前先进的在线检测器表现更优秀,甚至接近人类标注。
- 旋转不变的三维点云局部到全局表征学习
本文提出了一种面对各种几何变换,特别是旋转的局部到全局表示学习算法,该算法利用基于图卷积神经网络的多级抽象构建描述符层次结构,以自底向上的方式对输入对象的旋转不变形状信息进行编码,并通过对三维点的随机采样有效地使学习到的表示对输入数据的变化 - ECCV使用光栅的主动感知自动驾驶
本文提出了一种基于光幕的资源有效可控传感器,利用神经网络不确定性或优化算法来放置光幕,并开发了一种高效的优化算法来提高检测准确性.
- Triangle-Net:面向点云学习的鲁棒性
提出了一种基于图结构和神经网络的方法,能够同时实现旋转、平移、缩放的不变性以及点云稀疏程度的稳健性,此方法在模型识别与检索任务方面,其性能可显著提高。
- AAAI针对 3D 物体检测的任务感知单目深度估计
本文提出了一种单目深度估计方法,通过前景 - 背景分离以及单独优化前景深度和背景深度的目标函数和深度解码器,极大地提高了前景目标深度的估计性能,并在应用于 3D 对象检测中各方面都达到了最先进的成果。
- 缓解零样本学习 3D 物体的 Hubness 问题
本文提出了一种用于解决零样本学习中的 hubness 问题的新的损失函数,并在 ModelNet40、ModelNet10、McGill 和 SHREC2015 等数据集上进行了广泛的评估,建立了在 3D 情况下的零样本任务的最新成果。
- 多视图三维物体识别中的主导集聚类和池化
本研究提出了一种基于支配集的视角聚类和汇集层的三维物体识别方法,将其应用到现成的预训练 CNN 中,使多视角三维物体的识别准确率达到了 93.8%,其中还探讨了一种快速学习策略。
- 使用动态间隔的三重损失函数进行三维物体实例识别和姿态估计
本论文提出了一种使用卷积神经网络进行局部对象在杂乱环境中的 3D 对象实例识别和姿态估计的方法,通过引入动态边界到多样性拓扑学习的三元组损失函数中,来在低维描述符空间上建立对象相似度模型,采用新背景噪声类型和表面法线等多种模态的图像数据进行 - 单目深度估计:综述
论文综述了五篇应用不同技术(包括监督、弱监督和无监督学习技术)尝试解决单目深度估计问题的论文,并比较这些论文之间的改进和理解,最后探讨了可能有助于更好地解决这一问题的潜在改进。
- PVNet: 一种基于点云和多视图的联合卷积网络用于三维形状识别
本文介绍了一个新的 3D 形状识别框架:Point-View Network(PVNet),该框架整合了点云和多视角数据,并利用深度学习和嵌入式注意融合方案提高了 3D 形状的准确识别。
- CVPR多层次三维卷积神经网络学习多尺度空间特征
本文提出了一种基于多层体素网格的端到端多级学习方法来解决现有 3D 目标识别中结构化和非结构化数据表示的缺陷,结果表明该方法在节约内存的同时能够实现与密集体素表示相当的目标识别性能。
- 3D 对应关系分组算法的性能评估
本篇论文评估了几种广泛使用的 3D 数据对齐算法的效果,并在形状检索、三维对象识别和点云配准等场景中进行实验验证,总结了算法的优缺点。
- CVPR多视角 3D 物体检索的三元中心损失
研究了在三维目标检测中,利用不同的深度度量学习方法来提高检索效果的效果,并针对性的提出了三种不同的模型评估方式 —— 三元组损失、中心损失和三元组 - 中心损失,进行了广泛的实验验证和效果评估,最终和已有领先算法进行了效果对比。
- NIPS通过三维生成对抗建模学习物体形状概率潜空间
本文提出了一种新颖的框架,即 3D 生成对抗网络(3D-GAN),通过利用体积卷积网络和生成对抗网络的最新进展,从概率空间生成 3D 对象,并具有生成高质量 3D 对象、无先验 CAD 模型或图像依赖性、生成器从低维概率空间到 3D 空间的 - FusionNet: 使用多种数据表示进行的 3D 物体分类
利用体素表示法和像素表示法,使用卷积神经网络进行 3D 目标识别。使用新的 V-CNN 架构将两种表示法相结合,获得显著更好的分类器。