MST：自适应多尺度令牌引导的交互式分割

Jan, 2024

MST：自适应多尺度令牌引导的交互式分割

MST: Adaptive Multi-Scale Tokens Guided Interactive Segmentation

Long Xu, Shanghong Li, Yongquan Chen, Jun Luo

TL;DR通过多尺度令牌调整算法改善了交互式分割的准确度，以应对大目标和小目标间的准确度平衡挑战，并引入了对比损失以提高令牌的正确性和鲁棒性。与现有方法相比，该算法在绩效上达到了最新水平。发布了交互式演示和所有可复制的代码。

Abstract

In the field of Industrial Informatics, interactive segmentation has gained significant attention for its application in human-computer interaction and →

interactive segmentation multi-scale token adaptation algorithm segmentation accuracy human-computer interaction data annotation

发现论文，激发创造

MSViT：用于视觉 Transformer 的动态混合尺度分词

本文提出了一种动态混合尺度的 Vision Transformers 模式，通过引入条件门控机制，智能选择每个图像区域的最佳令牌规模进行处理，从而提高图像分类的精度和效率。

Jul, 2023

与人类标注者进行大规模交互式物体分割

本文提出了一种基于深度交互式分割模型的交互式对象分割方法，并利用真实人类注释数据集发布了一个实例分割数据集，同时还提供了一个自动评估模型以更好地保证注释质量。

Mar, 2019

通过加权适应关键标记来分段任何事件

在本研究中，我们深入探讨了将 Segment Anything Models（SAMs）与事件数据集成的微妙挑战，以实现稳健和通用的物体分割。我们提出了一种多尺度特征蒸馏方法，通过优化来自事件数据的令牌嵌入与其 RGB 图像对应物之间的对齐，从而保留和增强了整体架构的稳健性。通过对不同数据集的广泛实验，证明了所提出的蒸馏方法的有效性。

Dec, 2023

CloudAttention：用于 3D 点云学习的高效多尺度注意力方案

使用集合转换器在分层框架中对点云进行形状分类和分割，实现了状态 - of-the-art 的性能，并可用于处理大规模稀疏数据。

Jul, 2022

MTI-Net: 多尺度任务交互网络用于多任务学习

本文介绍了一种新架构 MTI-Net，它能够显式地模拟每个尺度的任务交互，并通过特征传播模块将提炼的任务信息从较低尺度传播到较高尺度，并通过特征聚合单元汇总所有尺度的任务特征以产生最终的任务预测。该架构通过两个多任务密集标记数据集上的广泛实验证明，相比以前的工作，我们的多任务模型实现了多任务学习的全部潜力，即较小的内存占用，减少计算次数，并与单任务学习相比表现更好。

Jan, 2020

医学图像的深度交互分割：系统综述与分类

交互式分割是医学图像分析中的一个关键研究领域，旨在通过引入人类反馈来提高昂贵注释的效率。近年来，基于深度学习的方法推动了结果的提升，并导致了该领域的快速增长。本综述提供了这一新兴领域的结构化概述，包括全面的分类、现有方法的系统综述以及对当前实践的深入分析。基于这些贡献，我们讨论了该领域的挑战和机遇，例如发现方法之间存在严重的比较缺乏，需要通过标准化基线和基准来解决。

Nov, 2023

TETRIS：探索交互分割的鲁棒性

通过对交互式分割模型的实际用户研究，发现常规评估策略的直观假设可能无法成立，因此建议采用直接优化的白盒对抗攻击方法来评估交互式分割模型的鲁棒性，并引入了一种新的鲁棒性度量标准和多个模型的广泛评估结果。

Feb, 2024

航空影像中的交互式分割：一个新的基准和一个开放的网络工具

最近几年，深度学习已成为遥感应用中强大的方法，尤其在从卫星和航空图像中提取重要地物的分割和分类技术中起到关键作用。然而，只有少数论文讨论了深度学习在地物覆盖分类任务中交互式分割的应用。本研究旨在通过对各种基于深度学习的交互式分割模型进行基准研究，弥合交互式分割和遥感图像分析之间的差距。我们在两个高分辨率航空影像数据集上评估了五种最先进的交互式分割方法（SimpleClick、FocalClick、Iterative Click Loss (ICL)、Reviving Iterative Training with Mask Guidance for Interactive Segmentation (RITM) 和 Segment Anything (SAM)）的性能。为了在不需要多个模型的情况下提高分割结果，我们引入了一种创新的推理策略 —— 级联前向细化（CFR）方法，用于交互式分割。我们在遥感中评估了这些交互式分割方法在不同的地物覆盖类型、目标尺寸和波段组合上的表现。令人惊讶的是，广为讨论的方法 SAM 在遥感图像中表现不佳。相反，SimpleClick 模型中使用的基于点的方法在所有实验中始终优于其他方法。基于这些发现，我们开发了一个名为 RSISeg 的专用在线工具，用于遥感数据的交互式分割。RSISeg 采用了一个性能良好的交互式模型，并通过遥感数据进行了微调。此外，我们把 SAM 模型集成到这个工具中。与现有的交互式分割工具相比，RSISeg 具有较强的交互性、可修改性和适应性。

Aug, 2023

多尺度和令牌合并：让您的 ViT 更高效

本文提出一种新的 token pruning 方法，通过筛选关键词实现计算效率和模型效果的折衷，实验结果表明，该方法可显著降低计算成本，同时仅导致 0.1% 的 DeiT-S 识别精度下降。

Jun, 2023

无上下文的多样手势类型交互分割

我们提出了一个简化的交互分割任务，支持多种手势类型，没有指定手势类型，通过引入第一个具有多个手势类型的交互分割数据集和一个新的评估度量来支持该任务。我们分析了许多交互分割算法，并分享了我们的新数据集。

Jul, 2023