- CVPRFocSAM: 深入研究分割任何物体中的聚焦对象
FocSAM 通过 Dynamic Window Multi-head Self-Attention 和 Pixel-wise Dynamic ReLU 的优化来提高 Segment Anything Model (SAM) 在交互式分割方 - GraCo:可控粒度的交互分割
我们介绍了一种名为 Granularity-Controllable Interactive Segmentation(GraCo)的新方法,通过引入额外参数来精确控制预测粒度,增强了交互系统的自定义性,消除了冗余并解决了模糊性。我们设计了 - CVPRMFP:充分利用概率图进行交互式图像分割
该研究提出了一种名为 MFP 的交互式图像分割算法,通过增强先前的概率图的表达以及将其作为额外的网络输入,该算法充分利用了概率图,相较于使用相同骨干的现有算法,MFP 的性能有显著提升。
- PRISM:一个带有视觉提示的可提示和稳健交互式分割模型
PRISM 是一个可提示和稳健的交互式分割模型,旨在精确地对三维医学图像进行分割。PRISM 接受各种视觉输入,包括点、框和涂鸦作为稀疏提示,以及蒙版作为密集提示。通过迭代学习、置信学习、纠正学习和混合设计,PRISM 在结直肠、胰腺、肝脏 - 在新情境中使用时适应分段任何事物模型
通过利用用户交互和构建的掩码生成伪标签,我们提出了一种在实时使用过程中可以调整 Segment Anything Model (SAM) 的框架,从而显著减小了在新领域或对象类型中进行交互式分割时的失效率。我们的方法在 FR_20@85 和 - 重新思考标注模拟:全身 PET 病灶交互分割方法的实际评估
通过引入四个评估度量值来量化真实用户和模拟用户之间的转换,我们提出一种更逼真的机器人用户,通过考虑点击变异和标注者之间的不一致性来减小模拟与真实用户之间的差距,并通过一个具体案例表明这种机器人用户相比传统机器人用户能够持续减少模拟与真实用户 - IFSENet:利用稀疏迭代实现交互式少样本分割的卓越性能
IFSENet 是一种结合了 few-shot 分割和交互式分割概念的模型,通过接受点击输入的方式在支持图像和查询图像上生成遮罩,极大地减少了训练新类别分割模型所需的注释工作量。
- 在交互式分割中利用基于 AI 预测和专家修订的标注:持续调整还是全面训练?
交互分割是集成人工智能算法和人类专业知识的方法,可以提高医疗卫生领域大规模、详细标注数据集的准确性和效率。本文提出了连续调整方法来解决 AI 预测和专家修订标注之间的两个问题,即灾难性遗忘和计算效率问题,通过网络设计和数据重复使用来改进 A - QIS:基于准保形映射的交互分割
我们提出了准保拟共形交互分割(QIS)模型,该模型通过正负点击将用户输入融入分割过程,以准确地分割包含噪声或遮挡的图像,同时避免拓扑错误,并在合成、医学、自然和噪声自然图像上进行了有效性验证。
- RAP-SAM:面向实时通用分割任何事物
通过转换器架构,本研究提出了一种新的实时分割方案,名为全能实时分割,旨在使用一个模型实现交互分割、全景分割和视频分割等不同任务,为视觉基础模型的实时应用提供了强有力的基准和优化方法。
- MST:自适应多尺度令牌引导的交互式分割
通过多尺度令牌调整算法改善了交互式分割的准确度,以应对大目标和小目标间的准确度平衡挑战,并引入了对比损失以提高令牌的正确性和鲁棒性。与现有方法相比,该算法在绩效上达到了最新水平。发布了交互式演示和所有可复制的代码。
- SqueezeSAM: 用户友好的移动交互分割
我们旨在开发一个适用于摄影应用的 SAM 模型的版本。SqueezeSAM 模型体系结构在性能和模型尺寸上相比原模型具有更高的效果,我们使用显著性物体检测生成初始分割掩码,用户可以进行交互编辑,并通过引入新的数据增强方案来实现期望点击相关物 - 滑动窗口快速编辑:全身 PET 图像中病变标注的框架
通过利用交互式滑动窗口的模式,SW-FastEdit 极大加速了标注过程,取代了体素级别的注释,从而解决了在 PET 全身扫描中分散的病变体积标记的问题,并在 AutoPET 数据集上表现优于其他非滑动窗口交互模型,且可以泛化到之前未见的 - 医学图像的深度交互分割:系统综述与分类
交互式分割是医学图像分析中的一个关键研究领域,旨在通过引入人类反馈来提高昂贵注释的效率。近年来,基于深度学习的方法推动了结果的提升,并导致了该领域的快速增长。本综述提供了这一新兴领域的结构化概述,包括全面的分类、现有方法的系统综述以及对当前 - 评估基于多种点提示的交互式 3D 医学图像分割的测试时可变性
通过对交互提示的工程化,我们评估了使用不同类型提示的医学图像交互分割模型在测试时间的可变性,以期找到一种简单高效的最佳提示选择方法。
- 评估和改进交互式组织病理学图像分割的 “任意分割模型
通过评估 Segment Anything Model (SAM) 在组织病理学数据的零样本和微调场景下的性能,并与其他最先进的交互模型进行比较,我们发现 SAM 在分割性能上相对较弱,而在推理时间和泛化能力方面相对较强。为了改进 SAM - 航空影像中的交互式分割:一个新的基准和一个开放的网络工具
最近几年,深度学习已成为遥感应用中强大的方法,尤其在从卫星和航空图像中提取重要地物的分割和分类技术中起到关键作用。然而,只有少数论文讨论了深度学习在地物覆盖分类任务中交互式分割的应用。本研究旨在通过对各种基于深度学习的交互式分割模型进行基准 - 辐射场的场景通用交互式分割
该研究论文对于在光辐射场中进行交互式分割的现有方法进行了探讨,并提出了一种新的 SGISRF 方法,能够通过少量用户交互点击,对由光辐射场表示的新场景进行 3D 物体分割。该方法通过三种特别设计的技术来解决三个关键挑战,并在多个实验中证明了 - MM特征解耦与重用网络快速交互式分割
我们提出了一种名为特征解耦循环网络(FDRN)的交互分割方法,通过解耦建模组件并循环利用组件来显著提高整个交互过程的效率,同时保持有利的分割性能。
- 无上下文的多样手势类型交互分割
我们提出了一个简化的交互分割任务,支持多种手势类型,没有指定手势类型,通过引入第一个具有多个手势类型的交互分割数据集和一个新的评估度量来支持该任务。我们分析了许多交互分割算法,并分享了我们的新数据集。