本研究提出了 PointCaps,一种新的卷积胶囊体系结构,以及一种新的欧几里得距离路由算法和类独立潜在表示,在原始点云的分类、重建和分割中拥有更好的表现,具有显著的参数和 FLOP 数量低的优势。
Dec, 2021
本文介绍了 3DCapsule 的概念,它是最近引入的 Capsule 概念的 3D 扩展,可以应用于无序点集。通过引入 ComposeCaps 层以替代空间相关的特征映射,学习可以被 3DCapsule 应用的新映射。通过消融实验表明,在其他 3D 点集分类架构中应用 3DCapsule 时,其性能得到改善,特别是在噪声数据方面。与最先进的方法进行比较得到本方法的性能优于传统方法。
Nov, 2018
提出一种能够处理点云的三维胶囊模块,它对于三维旋转和移动具有等变性,并且对于输入点的排列具有不变性;该模块通过四元数上的新颖动态路由过程来建立端到端的变换等变性;此外,作者在理论上将胶囊之间的动态路由与欧几里德旋转平均算法相连接,通过此连接,证明了这种路由方式能够被解释为对胶囊投票进行鲁棒的旋转平均,进而在大型数据集上进行了实验验证。
Dec, 2019
该论文研究了 CapsNets(胶囊网络)的吸引人之处,并聚焦于解锁其全部潜能的三个关键问题:路由算法的有效性、提取更有效的第一层胶囊、以及胶囊网络中的部分关系学习。此外,还展示了 CapsNets 在实际应用中的潜力,包括无人机的自主定位、合成数据集中的四元数旋转预测和生物医学成像中的肺结节分割。该论文的研究结果对于深入理解 CapsNets 并突破复杂的计算机视觉挑战具有重要意义。
May, 2024
提出了一种名为 CAPNet 的不可分辨投影模块,采用多个前景掩膜作为监督数据,通过连续逼近点云点来建立投影模型,通过 'affinity loss' 损失公式规避了稀疏投影问题,显著优于现有基于投影的方法,可在缺乏大量 3D 数据的情况下构建高质量 3D 重建。
本研究提出了一种自监督胶囊体系结构用于 3D 点云,其通过置换等变性注意力计算对象的胶囊分解,并通过随机旋转对象对进行训练。我们的关键思想是将注意力掩码聚合成语义关键点,并使用这些来监督满足胶囊不变性 / 等变性属性的分解,从而使训练具有语义一致的分解,同时还可以学习一种使对象集中化推理的标准化操作。通过自监督学习对象集中的表示,我们的方法在 3D 点云重建,规范化和无监督分类方面优于最先进的方法。
Dec, 2020
介绍了胶囊网络的基本概念和动机,以及它们在图像识别、视频、自然语言处理、医学成像等领域的广泛应用,探讨了胶囊网络研究中的主要障碍和未来研究的方向。
Jun, 2022
本文提出了一种深度自编码器,其中包括了图形拓扑推断和过滤模块,以实现对非结构化 3D 点云的紧凑表示,在无监督的情况下处理原始 3D 点云,优于其他目前的方法,进一步提高了无监督学习性能。
May, 2019
该研究提出了一种基于 transformer 的 encoder-decoder 结构的 3D 密集描述方法,包含相对空间感知机制,可以精准地为 3D 场景中的每个场景对象实现目标检测和自然语言描述生成。在两个基准数据集 ScanRefer 和 ReferIt3D 上,该方法均优于基线模型 Scan2Cap。
Apr, 2022
DeepCaps 是一个使用三维卷积动态路由算法的深度胶囊网络架构,通过引入识别物理属性的类独立编码器网络,使用重构损失作为正则化项,实现在 CIFAR10,SVHN 和 Fashion MNIST 上胶囊网络领域最先进的结果,并减少 68%的参数。
Apr, 2019