关键词surgical computer vision
搜索结果 - 3
- 外科计算机视觉的启动
通过自我监督学习,在不同手术数据集上进行预训练,从而灵活地利用多样化的手术数据,为各种手术下游任务学习与任务无关的表示,研究发现预训练数据集的组成严重影响自我监督学习方法在各种下游任务上的有效性,对于规模化应用自我监督学习方法应充分考虑预训 - 探索非配对图像翻译中的语义一致性,以生成外科应用数据
探索了无配对图像翻译技术在手术应用中生成具有语义一致性数据的可行性,并发现结构相似性损失和对比学习的简单组合方法取得了最有希望的结果。定量分析表明,使用这种方法生成的数据具有更高的语义一致性,可以更有效地用作训练数据。
- 通过观看数百个手术视频讲座学习多模态表示
该研究使用手术视频讲座来进行多模态表示学习,通过自动生成的文本转录来解决手术视频中的语言挑战,提出了一种新的对齐视频和文本嵌入的方法 SurgVLP,并介绍了一些用于手术的视觉与语言任务作为评估标准。