机器人手术中的SAM 2:外科视频分割的鲁棒性和泛化的实证评估
本研究探讨了Segment Anything Model在机器人手术领域的鲁棒性和零样本泛化能力,并发现该模型在利用点基提示和未提示的设置下,对机器人手术仪器的分割效果较差,且在一些复杂的手术场景中无法识别器械。同时,该模型也缺乏足够的鲁棒性,需要进一步进行领域特定的微调。
Apr, 2023
本文针对 Segment Anything Model(SAM)在医学图像分割领域的 zero-shot 泛化能力进行了研究,并发现模型对于不同数据集和提示的表现会有差异,通过提供适当的提示,如边界框,SAM的性能显著提高。
Apr, 2023
基于Segment Anything Model(SAM)的语义分割模型在机器人手术领域的鲁棒性、零样本泛化性能等方面进行了实证研究,发现SAM在使用边界框提示时表现出卓越的零样本泛化能力,但在点提示和未提示设置下,对仪器的整体分割困难重重,且在复杂手术场景中无法识别仪器且容易受到各种数据破坏形式的影响。提出的Low-rank Adaptation(LoRA)调整方法结合SAM,形成SurgicalSAM在不使用提示的情况下可以对各个类别的仪器进行遮罩预测,从而说明SAM在手术任务中仍需要进一步的专业领域微调。
Aug, 2023
我们引入了一种新颖的微调框架,通过批处理基于真实掩蔽的边界框引入批量提示策略,以提高Segment Anything Model 在医学图像上的性能表现和广泛的分割任务中解决医学图像中常见的复杂性和模糊性。
Oct, 2023
准确的工具分割对于计算机辅助程序至关重要。在医学场景中,由于存在伪影和有限的训练数据,这项任务存在挑战。在未见数据上具有普遍性的方法代表了一个有趣的途径,其中零样本分割提供了解决数据限制问题的选项。使用Segment Anything Model(SAM)进行初探性工作表明,基于边界框提示的方法具有显著的零样本普适性,然而基于点的提示导致性能下降,并且在图像破坏的情况下进一步恶化。我们认为,SAM在高度受损图像上进行了过度分割,导致仅考虑单个分割掩码时性能下降,而重叠目标的分割掩码的组合则能产生准确的预测。本文利用SAM生成内窥镜帧的过度分割预测,并使用地面真实工具掩膜分析SAM的结果,当选择最佳的单个掩码作为预测时以及当结合所有与感兴趣对象重叠的各个掩码以获得最终预测掩码时。我们使用合成损坏、强度不同的Endovis18和Endovis17仪器分割数据集以及一种自行创建的现实世界数据集进行分析。将过度分割的掩码组合可提高IoU。此外,在清晰图像上选择最佳单个分割时,得到了具有竞争力的IoU得分。结论:组合的SAM预测结果在一定程度的破坏下显示出了改进的结果和鲁棒性,然而在医学领域实施这些模型需要恰当的提示策略。
Feb, 2024
在这项研究中,我们采用轻量级的Segment Anything Model (SAM) 变体以满足速度要求,并采用微调技术来增强其在外科手术场景中的泛化能力。我们结合在线点追踪器和经过微调的轻量级SAM模型构建了一个新颖的框架,用于外科器械分割。在EndoVis 2015数据集上,定量结果超过了半监督视频对象分割方法的最新水平,并且可以在单个GeForce RTX 4060 GPU上以超过25 FPS的推理速度运行。
Mar, 2024
研究通过开发Surgical-DeSAM方法,利用Bounding Box提示和实时机器人手术,实现了实时仪器分割,并在MICCAI手术仪器分割挑战EndoVis 2017和2018数据集上显著改进仪器分割方法的性能。
Apr, 2024
本研究解决了在手术视频中缺乏标注数据和手术类型多样性导致的手术工具分割问题。我们采用了Segment Anything Model 2(SAM 2)进行零样本分割,其在不同手术类型视频中的性能展现了其有效性和适用性。研究结果表明,SAM 2在手术视频中表现出色,但在新工具出现时需额外提示以保持分割精度,同时手术视频的特性会影响其稳定性。
Aug, 2024
本研究解决了外科视频分割中的效率问题,提出了外科SAM 2(SurgSAM-2)模型,利用高效帧剪枝机制(EFP)实现实时分割。SurgSAM-2通过动态管理内存,仅保留最具信息量的帧,显著提高了分割精度与效率,达到3倍的帧率提升,推动了资源有限环境下外科视频分析的现实应用。
Aug, 2024
本研究探讨了现有的分割基础模型在处理生物医学图像和视频方面的应用,尤其聚焦于SAM2模型的适用性和局限性。通过适应和微调,研究指出SAM2在不同数据集和任务中的表现存在差异,但在减少注释负担和实现零-shot分割方面展现出潜力。该工作强调了填补自然与医学图像领域差距的重要性,促进了临床应用的发展。
Aug, 2024