- 具有动态查询的图像分割的持续学习
基于持续学习的图像分割方法,通过增量动态查询实现了概念解耦,克服了灾难性遗忘和背景漂移问题,同时在语义分割和实例分割任务上取得了最先进的性能。
- SAM-6D:分割全能模型满足零射 6D 物体姿态估计
通过实例分割和姿态估计两个步骤,SAM-6D 是一个新的框架,用于在杂乱的 RGB-D 图像中实现零样本 6D 物体姿态估计的任务,并在 BOP 基准的七个核心数据集上超越现有方法。
- 适配器是调整视觉任务所需的全部
通过引入多个适合视觉信号处理的视觉友好滤波器和缩放归一化层,提出了一种名为 Mona 的多认知视觉适配器调谐方法,该方法超越了全面微调在实例分割和语义分割任务上的性能,并适用于多个代表性的视觉任务。
- 理解自监督特征用于学习无监督实例分割
自我监督学习(SSL)可以用于解决复杂的视觉任务,该论文研究了实例分割的自我监督表示,发现不同 SSL 方法的特征在实例感知水平上存在差异。
- OneFormer3D:统一点云分割的一种 Transformer
本文提出了一种统一、简单、有效的模型 OneFormer3D,利用可学习的卷积核同时处理实例分割和语义分割,通过输入统一的实例和语义查询来训练,并在 ScanNet 测试排行榜中取得了第一名和新的最佳性能,同时在 ScanNet、ScanN - 自训练全景分割
通过自学习方法在合成到真实的领域适应问题设置中,开发了一个基于嵌入的自学习全景分割框架。
- PWISeg:点云弱监督下的手术器械实例分割
我们提出了一种新的弱监督手术器械实例分割方法,名为基于点的弱监督实例分割(PWISeg)。该方法通过采用基于 FCN 的架构,使用点到框和点到掩模分支来建模特征点与边界框以及特征点与分割掩模之间的关系,在单个模型中联合完成手术器械的检测和分 - 3DFusion,基于实例分割流数据的实时 3D 物体重建流水线
该论文介绍了一个实时分割和重构系统,利用 RGB-D 图像生成准确而详细的物体三维模型,可以应用于增强 / 虚拟现实、室内设计、城市规划、道路辅助和安全系统等领域。通过采样连续帧以减少网络负载并确保重构质量,采用多进程 SLAM 管道实现并 - ISAR:单次和少次目标实例分割与重新标定的基准
我们提出 ISAR,这是一个单次和少次样本对象实例分割与重新识别的基准和基线方法,以加速能够从单个或少数稀疏训练样本中稳健地检测、分割和重新识别对象的算法的发展。
- ICCV多边形标注中的不确定性及质量保证的实证研究
本文旨在研究和量化多边形标注的固有不确定性以及质量保证在减小其影响中的作用。通过对 MS-COCO 数据集中多个对象的多个标注者的多边形注释进行分析,结果表明多边形注释的可靠性取决于审查程序以及场景和形状的复杂程度。
- CML-MOTS:协同多任务学习用于多目标跟踪和分割
我们提出了一个在视频帧上进行实例级视觉分析的有效框架,可以同时进行对象检测、实例分割和多对象跟踪。通过一种名为关联连接的新型结构,我们实现了协同多任务学习,在可学习的 CNN 中的检测、分割和跟踪任务之间建立了额外的连接。这些额外的连接允许 - 通过位置感知的复制粘贴数据增强实现遮挡下的实例分割
采用鲁棒的数据增强技术和深度学习架构,通过提出一种新的数据增强技术、采用混合任务级联(HTC)框架和 CBNetV2 作为骨干架构以及引入 Stochastic Weight Averaging(SWA)训练策略,该论文在篮球场景中分割人体 - 全景非分布式分割
深度学习在全景分割方面取得了显著进展,但是全景分割在存在分布外(OOD)对象的情况下受到严重影响。为了解决这个问题,我们提出了一种用于联合像素级语义内部分布和分布外分类的分割方法。我们基于 Panoptic 分割基准数据集 Cityscap - ICCV检测和实例分割的关系先验知识图
本文探讨了使用关系来进行对象检测和实例分割的有效性,并提出了一种基于关系先验的特征增强模型(RP-FEM),该模型通过图形变换器利用关系先验增强对象建议特征。实验结果表明,利用增加了关系先验的场景图可提高对象检测与实例分割的效果。RP-FE - CUPre:跨域无监督预训练用于少样本细胞分割
通过跨域无监督预训练 (CUPre),利用未标记的细胞图像将目标检测和实例分割的能力从 Common Objects in Contexts (COCO) 数据集转移到细胞图像领域,从而实现对少样本细胞分割的预训练,最终实验结果表明 CUP - 基于 YOLOR 的多任务学习
通过建议的架构和训练策略,我们在多个任务上实现了竞争性的性能,同时保持较低的参数数量和无需预训练。
- 稠密实例分割在肾脏活检结构评估中的进展
该研究提出了一种基于扩散模型、Transformer 模块和 RCNN 的无锚点实例分割模型,能有效识别肾脏活检中的肾小球、肾小管和动脉,成为新的最先进方法,达到了 51.7% 的检测准确率。
- ICCV利用不确定性和多样抽样的两步主动学习实例分割
我们提出了一种后期主动学习算法,该算法将基于不确定性的采样与基于多样性的采样相结合,不仅简单易实现,而且在各种数据集上都具有出色的表现,其实际应用在实际的高空图像数据集中增加了五倍的标注效率。
- ICCV静止肖像照片中头发吹动的自动动画
我们提出了一种新颖的方法来在静止的肖像照片中为人发进行动画。通过先进的实例分割网络,我们的方法提取有意义和自然的发丝,并提出了一种发丝感知的动画模块,以令人愉悦的动作方式进行发丝动画,同时避免明显的伪影。广泛的实验证明了我们方法的优越性,在 - MosaicFusion:扩容词汇实例分割的扩散模型数据增强器
MosaicFusion 是一种简单而有效的基于扩散的数据增强方法,用于大词汇实例分割,通过文本到图像扩散模型生成合成标记数据,提高现有实例分割模型在罕见和新颖类别上的性能。