FocalClick: 实用交互式图像分割

CVPRApr, 2022

FocalClick: Towards Practical Interactive Image Segmentation

Xi Chen, Zhiyan Zhao, Yilei Zhang, Manni Duan, Donglian Qi...

TL;DRFocalClick 提出了一种交互式分割模型，通过两个快速推理处理目标区域与焦点区域的粗分割和局部细分割，采用渐进式合并的方法有效地对预先存在的分割遮罩进行修正，同时在 FLOP 显著更小的情况下实现了与 SOTA 方法相当的结果。

Abstract

interactive segmentation allows users to extract target masks by making positive/negative clicks. Although explored by many previous works, there is still a gap between academic approaches and industrial needs: first, existing models are not efficient enough to work on low power device

interactive segmentation efficiency mask refinement focalclick progressive merge

发现论文，激发创造

PseudoClick: 带有点击模拟的交互式图像分割

本文提出一个名为 PseudoClick 的框架，使得现有的分割网络能够提出候选的下一步点击，从而进一步减少用户交互成本，该框架的目标是通过最少的用户点击来获得精确的对象分割掩码。

Jul, 2022

AdaptiveClick: 适应点击感知 Transformer 与自适应 Focal Loss 用于交互式图像分割

AdaptiveClick 是一种基于 Transformer 的、面向 Interactive Image Segmentation 的 mask-adaptive 分割框架，它通过引入 CAMD 和 Adaptive Focal Loss 解决了数据标注的不一致性和困难样本问题，实验结果显示其在 9 个数据集上超越了现有的其他方法。

May, 2023

PiClick: 基于点击的交互式分割中选择所需掩模

提出了一种基于交互式分割的语义多样性分割网络 PiClick，利用 Transformer 网络结构实现互动式 mask 查询，设计了 Target Reasoning 模块，能够自动推断出所有建议中最匹配的 mask，显著减少了目标模糊性以及额外人工干预。

Apr, 2023

交互式图像分割的聚焦和协作反馈集成

本研究提出了一种新的交互式图像分割方法 FCFI，使用用户注释和反馈整合来优化分割结果，并在四个基准测试中取得了领先于现有方法的最新最佳表现。

Mar, 2023

使用遮罩引导恢复迭代训练进行交互式分割

本文介绍了一种基于前向传递的点击交互式分割模型，无需额外的优化技巧即可实现最新的最佳结果，并且对于性能的分析表明，使用 COCO 和 LVIS 的训练数据集所训练的模型表现最佳。

Feb, 2021

基于文本和点击输入的明确无歧义开放词汇实例分割

我们提出了一种新的分割过程，即文本 + 点击分割，其中模型接受图像、描述类别的文本短语和指定要分割的实例的单击作为输入，相比以往方法，我们利用开放词汇的图像 - 文本模型支持广泛的文本提示，通过在文本提示上调节分割结果提高了对于新颖或未见类别的分割准确性。

Nov, 2023

航空影像中的交互式分割：一个新的基准和一个开放的网络工具

最近几年，深度学习已成为遥感应用中强大的方法，尤其在从卫星和航空图像中提取重要地物的分割和分类技术中起到关键作用。然而，只有少数论文讨论了深度学习在地物覆盖分类任务中交互式分割的应用。本研究旨在通过对各种基于深度学习的交互式分割模型进行基准研究，弥合交互式分割和遥感图像分析之间的差距。我们在两个高分辨率航空影像数据集上评估了五种最先进的交互式分割方法（SimpleClick、FocalClick、Iterative Click Loss (ICL)、Reviving Iterative Training with Mask Guidance for Interactive Segmentation (RITM) 和 Segment Anything (SAM)）的性能。为了在不需要多个模型的情况下提高分割结果，我们引入了一种创新的推理策略 —— 级联前向细化（CFR）方法，用于交互式分割。我们在遥感中评估了这些交互式分割方法在不同的地物覆盖类型、目标尺寸和波段组合上的表现。令人惊讶的是，广为讨论的方法 SAM 在遥感图像中表现不佳。相反，SimpleClick 模型中使用的基于点的方法在所有实验中始终优于其他方法。基于这些发现，我们开发了一个名为 RSISeg 的专用在线工具，用于遥感数据的交互式分割。RSISeg 采用了一个性能良好的交互式模型，并通过遥感数据进行了微调。此外，我们把 SAM 模型集成到这个工具中。与现有的交互式分割工具相比，RSISeg 具有较强的交互性、可修改性和适应性。

Aug, 2023

深度交互式物体选择

本研究介绍一种新颖的基于深度学习的算法来解决交互式物体选择的问题，该算法可以将用户提供的正负反馈转换成欧几里得距离图，并与图像的 RGB 通道拼接，采用多种随机采样策略生成图像和用户交互对，通过 Fine-tune 深度反卷积网络，最终结果融合图像概率图和图切割优化，实现对物体边界的精细提取。实验结果表明，该算法具有较好的泛化能力，优于所有现有的交互式物体选择方法。

Mar, 2016

Panoptic One-Click 分割：应用于农业数据

本研究提出了一种精准农业方法，采用弱监督学习技术和点击输入，提出一种高效准确的离线工具 —— 全景一键分割法，它可以在降低标注数据成本的同时，有效地定位和分割所有的作物对象。在糖菜和玉米图像数据上的表现表明，我们的方法不仅与传统的一键分割法比拼，而且训练速度更快，使得我们能够将众多的边缘标记转化为面标记，从而有效地提高了模型的性能

Mar, 2023

交互式分割达到 99% 精度

本文提出了一种新的交互式架构和训练方案，旨在更好地利用用户工作流，并展示出引入专门设计用于复杂对象边界的合成训练数据集可以进一步获得显着的改进，该网络达到了最先进性能。

Mar, 2020