EipFormer：强调三维实例分割中的实例位置

Dec, 2023

EipFormer：强调三维实例分割中的实例位置

EipFormer: Emphasizing Instance Positions in 3D Instance Segmentation

Mengnan Zhao, Lihe Zhang, Yuqiu Kong, Baocai Yin

TL;DR提出了一种基于 Transformer 的架构 EipFormer，包括渐进聚合和双位置嵌入，用于 3D 实例分割，通过优化实例位置和提案来提高模型性能。

Abstract

3d instance segmentation plays a crucial role in comprehending 3D scenes. Despite recent advancements in this field, existing approaches exhibit certain limitations. These methods often rely on fixed instance positions obtained from sampled representative points in vast 3D point clouds

3d instance segmentation transformer-based architecture progressive aggregation dual position embedding performance

发现论文，激发创造

PSGformer：通过精确的语义引导增强 3D 点云实例分割

本文提出 PSGformer，一种新颖的 3D 实例分割网络，通过多级语义聚合模块和平行特征融合 Transformer 模块，完整地利用全局和局部语义信息，有效提高了分割水平，实现在 ScanNetv2 数据集上取得了当前最佳结果。

Jul, 2023

OneFormer3D：统一点云分割的一种 Transformer

本文提出了一种统一、简单、有效的模型 OneFormer3D，利用可学习的卷积核同时处理实例分割和语义分割，通过输入统一的实例和语义查询来训练，并在 ScanNet 测试排行榜中取得了第一名和新的最佳性能，同时在 ScanNet、ScanNet200 和 S3DIS 数据集上展示了最领先的语义、实例和全景分割结果。

Nov, 2023

CenterFormer：基于中心点的 Transformer 用于 3D 物体检测

本文提出了一种基于中心点的变换网络 ——CenterFormer，它使用查询嵌入来聚合中心候选点的特征向量，并设计了一种通过交叉注意力来融合多帧特征的方法。在 Waymo Open 数据集上，CenterFormer 在单个模型上实现了先进水平，取得了 73.7% 的验证集和 75.6% 的测试集 mAPH, 显著优于以前所有已发表的基于 CNN 和 transformer 的方法。

Sep, 2022

使用概率嵌入进行点云实例分割

本文提出了一种新的点云实例分割框架，其中包括嵌入步骤和聚类步骤。嵌入步骤中，每个点用三元正态分布表示，聚类步骤中，提出了一种有利于语义分割和聚类的新损失函数，并在 PartNet 数据集上实验得到了显著的改进。

Nov, 2019

Pointformer 进行的 3D 物体检测

本文提出了一种 3D 点云特征学习模型 Pointformer，其中使用局部和全局 Transformer 模块对点云数据进行建模，结合了多尺度特征，以及使用坐标调整模块改善物体提议生成，成功地应用于室内和室外场景下目标检测任务，并取得了显著的性能提升。

Dec, 2020

全幻灯片图像分类中的位置感知多实例学习的 RoFormer

整个切片图像（WSI）分类是计算病理学中的一个关键任务，目前深度学习在处理这种大小为千兆像素的图像方面仍存在重大挑战。我们提出了一种称为 RoFormer 层的简单编码模块，采用了内存高效的准确自注意力和相对位置编码，在大型和任意形状的 WSI 切块上进行全自注意力，解决了实例间相关性和组织的空间建模问题。我们的方法在弱监督分类任务上比最先进的 MIL 模型在三个常用的公共数据集（TCGA-NSCLC，BRACS 和 Camelyon16）上表现出色。

Oct, 2023

InstaFormer：具有 Transformer 的实例感知图像翻译

提出了一种新型的基于 Transformer 的网络结构 InstaFormer，用于实例感知的图像到图像的转换，可以有效地整合全局和实例级信息，通过自注意力模块在 Transformers 中考虑上下文信息，通过将通过边界框信息从内容特征中提取的实例级特征与这些标记相结合，我们的框架能够学习对象实例和全局图像之间的互动，从而提高实例感知能力，同时在标准 Transformer 中使用自适应实例归一化（AdaIN）代替层规范化（LayerNorm），以启用具有风格编码的多模式翻译。另外，为了提高实例感知能力和物体区域的翻译质量，介绍了一种实例级内容对比损失，定义了输入图像和翻译图像之间的对比损失。实验表明，与最新方法相比，我们的 InstaFormer 具有更好的性能。

Mar, 2022

用于 3D 点云分析的收集和分配变换器

本研究提出了 CDFormer，一种新的利用收集和分布机制的 Transformer 架构，可对点云的局部和全局结构进行有效学习，并在四个流行的点云数据集上取得了新的最佳分类和分割结果。

Jun, 2023

Geodesic-Former: 基于测地线引导的少样本 3D 点云实例分割器

本文介绍了一个新的三维点云问题：少样本实例分割。提出了一个基于测地线引导的转换器，用于解决 LiDAR 点云中密度不平衡的问题，并在 ScannetV2 和 S3DIS 数据集上测试了其性能。

Jul, 2022

基于多层深度和极线变换的三维场景重建

此研究论文研究如何从单个 RGB 图像自动重建场景的完整 3D 模型，它采用一种新的 Epipolar Feature Transformer 技术来联合图像的多层深度表示和卷积神经网络特征以提高场景信息的准确性。

Feb, 2019