Sep, 2024

SURGIVID:高效注释的外科视频物体发现

TL;DR本研究针对外科视频中工具和解剖结构的像素级定位问题,提出了一种高效的注释框架,利用图像自监督物体发现方法来识别外科场景中的关键工具和结构。在仅用36个注释标签的条件下,我们的方法显示出与完全监督模型相当的定位性能,并通过使用外科阶段标签进一步提升了约2%的工具定位准确率。