EipFormer:强调三维实例分割中的实例位置
本文提出 PSGformer,一种新颖的 3D 实例分割网络,通过多级语义聚合模块和平行特征融合 Transformer 模块,完整地利用全局和局部语义信息,有效提高了分割水平,实现在 ScanNetv2 数据集上取得了当前最佳结果。
Jul, 2023
本文提出了一种统一、简单、有效的模型 OneFormer3D,利用可学习的卷积核同时处理实例分割和语义分割,通过输入统一的实例和语义查询来训练,并在 ScanNet 测试排行榜中取得了第一名和新的最佳性能,同时在 ScanNet、ScanNet200 和 S3DIS 数据集上展示了最领先的语义、实例和全景分割结果。
Nov, 2023
本文提出了一种基于中心点的变换网络 ——CenterFormer,它使用查询嵌入来聚合中心候选点的特征向量,并设计了一种通过交叉注意力来融合多帧特征的方法。在 Waymo Open 数据集上,CenterFormer 在单个模型上实现了先进水平,取得了 73.7% 的验证集和 75.6% 的测试集 mAPH, 显著优于以前所有已发表的基于 CNN 和 transformer 的方法。
Sep, 2022
本文提出了一种新的点云实例分割框架,其中包括嵌入步骤和聚类步骤。嵌入步骤中,每个点用三元正态分布表示,聚类步骤中,提出了一种有利于语义分割和聚类的新损失函数,并在 PartNet 数据集上实验得到了显著的改进。
Nov, 2019
本文提出了一种 3D 点云特征学习模型 Pointformer,其中使用局部和全局 Transformer 模块对点云数据进行建模,结合了多尺度特征,以及使用坐标调整模块改善物体提议生成,成功地应用于室内和室外场景下目标检测任务,并取得了显著的性能提升。
Dec, 2020
整个切片图像(WSI)分类是计算病理学中的一个关键任务,目前深度学习在处理这种大小为千兆像素的图像方面仍存在重大挑战。我们提出了一种称为 RoFormer 层的简单编码模块,采用了内存高效的准确自注意力和相对位置编码,在大型和任意形状的 WSI 切块上进行全自注意力,解决了实例间相关性和组织的空间建模问题。我们的方法在弱监督分类任务上比最先进的 MIL 模型在三个常用的公共数据集(TCGA-NSCLC,BRACS 和 Camelyon16)上表现出色。
Oct, 2023
提出了一种新型的基于 Transformer 的网络结构 InstaFormer,用于实例感知的图像到图像的转换,可以有效地整合全局和实例级信息,通过自注意力模块在 Transformers 中考虑上下文信息,通过将通过边界框信息从内容特征中提取的实例级特征与这些标记相结合,我们的框架能够学习对象实例和全局图像之间的互动,从而提高实例感知能力,同时在标准 Transformer 中使用自适应实例归一化(AdaIN)代替层规范化(LayerNorm),以启用具有风格编码的多模式翻译。另外,为了提高实例感知能力和物体区域的翻译质量,介绍了一种实例级内容对比损失,定义了输入图像和翻译图像之间的对比损失。实验表明,与最新方法相比,我们的 InstaFormer 具有更好的性能。
Mar, 2022
本研究提出了 CDFormer,一种新的利用收集和分布机制的 Transformer 架构,可对点云的局部和全局结构进行有效学习,并在四个流行的点云数据集上取得了新的最佳分类和分割结果。
Jun, 2023
本文介绍了一个新的三维点云问题:少样本实例分割。提出了一个基于测地线引导的转换器,用于解决 LiDAR 点云中密度不平衡的问题,并在 ScannetV2 和 S3DIS 数据集上测试了其性能。
Jul, 2022
此研究论文研究如何从单个 RGB 图像自动重建场景的完整 3D 模型,它采用一种新的 Epipolar Feature Transformer 技术来联合图像的多层深度表示和卷积神经网络特征以提高场景信息的准确性。
Feb, 2019