SAMSNeRF: 通过神经辐射场(NeRF)的动态手术场景重建,由Segment Anything Model (SAM)指导
本研究探讨了Segment Anything Model在机器人手术领域的鲁棒性和零样本泛化能力,并发现该模型在利用点基提示和未提示的设置下,对机器人手术仪器的分割效果较差,且在一些复杂的手术场景中无法识别器械。同时,该模型也缺乏足够的鲁棒性,需要进一步进行领域特定的微调。
Apr, 2023
手术场景分析中使用人工智能的分割是一个基本问题。然而,这个领域内固有的数据稀缺性使得为该任务调整传统分割技术变得具有挑战性。因此,我们提出了一种名为AdaptiveSAM的改进模型,可以快速有效地适应新的数据集,并可以使用文本提示进行分割,其在各种医学图像数据集上优于当前最先进的方法。
Aug, 2023
基于Segment Anything Model(SAM)的语义分割模型在机器人手术领域的鲁棒性、零样本泛化性能等方面进行了实证研究,发现SAM在使用边界框提示时表现出卓越的零样本泛化能力,但在点提示和未提示设置下,对仪器的整体分割困难重重,且在复杂手术场景中无法识别仪器且容易受到各种数据破坏形式的影响。提出的Low-rank Adaptation(LoRA)调整方法结合SAM,形成SurgicalSAM在不使用提示的情况下可以对各个类别的仪器进行遮罩预测,从而说明SAM在手术任务中仍需要进一步的专业领域微调。
Aug, 2023
通过采用神经辐射场(NeRF)方法,我们展示了一种能够学习时间上动态且可变形的三维场景的方法,并能适应各种不同相机和场景设置的鲁棒性模型,该模型消除了已知相机姿态的限制,并克服了目前静态场景重构技术中依赖场景静态部分进行精准重构的缺点,为当前和未来的机器人外科手术系统提供了潜力。
Sep, 2023
准确的工具分割对于计算机辅助程序至关重要。在医学场景中,由于存在伪影和有限的训练数据,这项任务存在挑战。在未见数据上具有普遍性的方法代表了一个有趣的途径,其中零样本分割提供了解决数据限制问题的选项。使用Segment Anything Model(SAM)进行初探性工作表明,基于边界框提示的方法具有显著的零样本普适性,然而基于点的提示导致性能下降,并且在图像破坏的情况下进一步恶化。我们认为,SAM在高度受损图像上进行了过度分割,导致仅考虑单个分割掩码时性能下降,而重叠目标的分割掩码的组合则能产生准确的预测。本文利用SAM生成内窥镜帧的过度分割预测,并使用地面真实工具掩膜分析SAM的结果,当选择最佳的单个掩码作为预测时以及当结合所有与感兴趣对象重叠的各个掩码以获得最终预测掩码时。我们使用合成损坏、强度不同的Endovis18和Endovis17仪器分割数据集以及一种自行创建的现实世界数据集进行分析。将过度分割的掩码组合可提高IoU。此外,在清晰图像上选择最佳单个分割时,得到了具有竞争力的IoU得分。结论:组合的SAM预测结果在一定程度的破坏下显示出了改进的结果和鲁棒性,然而在医学领域实施这些模型需要恰当的提示策略。
Feb, 2024
在这项研究中,我们采用轻量级的Segment Anything Model (SAM) 变体以满足速度要求,并采用微调技术来增强其在外科手术场景中的泛化能力。我们结合在线点追踪器和经过微调的轻量级SAM模型构建了一个新颖的框架,用于外科器械分割。在EndoVis 2015数据集上,定量结果超过了半监督视频对象分割方法的最新水平,并且可以在单个GeForce RTX 4060 GPU上以超过25 FPS的推理速度运行。
Mar, 2024
研究通过开发Surgical-DeSAM方法,利用Bounding Box提示和实时机器人手术,实现了实时仪器分割,并在MICCAI手术仪器分割挑战EndoVis 2017和2018数据集上显著改进仪器分割方法的性能。
Apr, 2024
本研究解决了在手术视频中缺乏标注数据和手术类型多样性导致的手术工具分割问题。我们采用了Segment Anything Model 2(SAM 2)进行零样本分割,其在不同手术类型视频中的性能展现了其有效性和适用性。研究结果表明,SAM 2在手术视频中表现出色,但在新工具出现时需额外提示以保持分割精度,同时手术视频的特性会影响其稳定性。
Aug, 2024
本研究针对机器人辅助手术中的视频分割挑战,探讨了Segment Anything Model (SAM) 2的零样本分割性能及其对现实世界干扰的鲁棒性。通过在MICCAI EndoVis 2017和2018基准数据集上的广泛实验,结果显示,SAM 2在使用边界框提示时超越了最先进的方法,并在1点提示的应用中接近或超过了现有的无提示方法,展示了其在有限提示需求下的潜力。
Aug, 2024
本研究解决了外科视频分割中的效率问题,提出了外科SAM 2(SurgSAM-2)模型,利用高效帧剪枝机制(EFP)实现实时分割。SurgSAM-2通过动态管理内存,仅保留最具信息量的帧,显著提高了分割精度与效率,达到3倍的帧率提升,推动了资源有限环境下外科视频分析的现实应用。
Aug, 2024