内窥镜伪影检测(EAD 2019)挑战数据集
结直肠癌是世界上最常见的癌症之一。本文描述了 2022 年 EndoVis 挑战赛中的人工结直肠三维重建问题及其解决方案的研究成果,并展示了虚拟结直肠镜检查中深度预测问题的可靠解决方案,同时指出姿态估计问题仍然是一个待解决的研究方向。
Jul, 2023
为了在临床实践中整合实时人工智能系统,需要解决数据可用性、数据质量和缺乏多样性数据集等挑战。为此,我们介绍了 GastroVision,一个多中心开放获取的胃肠内镜数据集,该数据集包括来自胃肠道的 24 种不同病理异常、息肉切除病例和正常发现,提供了大规模、精确标记的多样化数据集,并验证了数据集的重要性。我们相信,该数据集可以促进基于人工智能的胃肠疾病检测和分类算法的开发。
Jul, 2023
本文提出了一个利用深度学习来改善诊断失误率的框架,针对胃肠道癌症的诊断,利用端到端的师生学习方式,采用多类别学生网络来利用训练过的师范模型的类别概率,从而提高困难检测病变的定位并最小化漏检率,模型在两个数据集上都实现了更高的 mAP,并且具有泛化性。
Jul, 2022
通过 EndoVis 工作坊提出的机器人仪器分割数据集,在模拟真实手术时应用于学习适用的技术,其中包括了最先进的 U-Net 和其他流行的 CNN 架构,并且逐步增加这个数据集的复杂性,包括针对器械,类型和解剖器官的分割。
Jan, 2020
我们提出了一个多重视觉伪影检测器,能够使用单一框架检测多种伪影类型,并且不依赖视频质量评估模型。该模型通过一种新的感知伪影时空特征提取器和一个循环记忆视觉变换器模块进行处理,实现全面优化,并在两个视频伪影数据库上取得了一致且改进的预测结果。
May, 2024
该研究提出一种基于双目内窥镜深度估计和光流的深度声明网络,通过减小两个几何损失优化相机姿态估计,并且引入了两个自适应的像素权重映射来平衡贡献,实现在挑战性的内窥镜手术场景中更加鲁棒的相机姿态估计,具有推进微创外科领域相关任务(如 SLAM 或 3D 重建)的研究意义。
Apr, 2023
本文介绍了音频深度合成检测(ADD)挑战的参赛系统,在低质量伪造音频检测和部分伪造音频检测领域取得了不错的成绩,通过使用时间信号、频谱特征和深度嵌入特征等方法检测音频中的光谱 - 时间畸变,并使用各种方法增强了数据的质量以及进行筛选,最终排名分别为第四和第五。
Oct, 2022
使用大型语言和视觉模型的最新进展,我们提出了 EndoKED,一种用于深度知识提取和蒸馏的数据挖掘范式,可以自动将原始结肠镜记录转化为具有像素级注释的图像数据集。通过验证 EndoKED 使用的多中心原始结肠镜记录数据集(约 100 万张图像),我们证明其在训练息肉检测和分割模型方面具有卓越的性能。此外,EndoKED 预训练的视觉骨干为光学活检提供了数据高效和可推广的学习,实现了回顾性和前瞻性验证中的专家级表现。
Oct, 2023
自动分析结肠镜图像是一项活跃的研究领域,该研究受到早期检测癌前息肉重要性的驱动。深度学习作为有望解决该挑战的一种方法,可以帮助结肠镜检医生实时发现和分类被忽视的息肉和异常。为了推动高效透明方法的发展,我们组织了两个竞赛,针对医学自动息肉分割和医学图像分割透明度。通过综合分析这些挑战,我们不仅突出了息肉和手术工具分割的进展,还鼓励定性评估,以构建更透明、可理解的基于人工智能的结肠镜系统。
Jul, 2023