视网膜图像匹配的半监督关键点检测与描述符
利用深度学习的方法,本研究提出了一种名为 ConKeD 的新型描述符,结合领域特定关键点实现视网膜图像配准,并通过新颖的多正面多负面对比学习策略,展示了比传统方法更好的性能,具有潜在的发展和应用前景。
Jan, 2024
RetinaRegNet 模型在不需要对任何视网膜图像进行训练的情况下,通过使用来自扩散模型的图像特征建立两个视网膜图像之间的点对应关系,实现了各种视网膜图像注册任务的最先进性能。该模型通过逆一致性约束和基于变换的异常点检测器去除估计的点对应关系中的异常值,并通过二阶图像配准和更精确的三阶多项式变换处理大变形,已在三个视网膜图像数据集上证明了其优越性能。
Apr, 2024
本论文提出一个半监督学习框架,利用多视图图像流训练关键点检测器,以弥补有限标注数据的不足。作者使用多视图几何和视觉跟踪的互补关系提供三种监督信号,使用未标记的数据训练网络,证明其优于 DeepLabCut 等现有的关键点检测器,特别适用于猴、狗、老鼠等非人类物种的关键点检测。
Nov, 2018
本文提出了一种基于 ResNet 模型的统一框架,用于关键点检测、特征提取和图像检索,不需要使用点对点的训练数据,利用通用技术在标准 ResNet 模型的连续层中提取局部信息,通过局部响应值的池化提取全局信息,可以在各种具有挑战性的评估条件下获得与最先进方法相当的结果,而无需像素级对应关系的监督。
Jan, 2020
本文介绍了一种基于无监督深度学习的兴趣点检测器和描述器 - UnsuperPoint。使用自监督方法,使用孪生网络和一种新的损失函数,允许兴趣点得分和位置自动学习。而且,该模型不需要生成伪真实点,也不需要从运动中生成的表示,并且只需要一轮训练即可学习。此外,还引入了一种新的损失函数,以使网络预测均匀分布。UnsuperPoint 在 $224 imes320$ 和 $480 imes640$ 分辨率下可以实现每秒 323 帧和 90 帧的实时运行,并在速度、可重复性、定位、匹配得分和单应估计表现方面与最先进的性能相当或更好,在 HPatch 数据集上取得了良好的表现。
Jul, 2019
本文介绍了一种名为 RetinaFace 的检测器,采用联合额外监督和自监督多任务学习,在各种尺度的人脸上实现了像素级别的人脸定位,并采用 5 个额外的面部标记,取得了显著的性能提升。
May, 2019
本文提出了一种自监督框架,用于训练适用于计算机视觉中大量多视图几何问题的兴趣点检测器和描述符。通过引入多尺度、多单应性方法的 Homographic Adaptation,我们的模型通过训练于 MS-COCO 数据集,能够相对于其他传统角点检测器和深度模型,检测到更丰富的兴趣点,并在 HPatches 上取得了最先进的单应性估计结果。
Dec, 2017
本文提出了一种新颖的 Retina U-Net 结构,以提高小型医学图像数据集中目标检测效率,该结构自然地将单级探测器与医学图像语义分割中广泛使用的 U-Net 架构相结合,并通过补充对象检测与语义分割形式的辅助任务来重新捕获监督信号,从而取得更好的检测效果。
Nov, 2018
RetinaTrack 是一种用于自动驾驶的联合的、简单而高效的多目标跟踪和目标检测模型,相较于当前业界最先进的跟踪算法有更好的表现且需要更少的计算量。
Mar, 2020
糖尿病性视网膜病变(DR)是全球致盲的重要原因,早期检测和有效治疗的迫切需求引起了关注。研究中提出了一种针对 DR 检测的新型半监督图学习(SSGL)算法,充分利用标记和未标记数据之间的关系以提高准确性。该研究通过研究数据增强和预处理技术来解决图像质量和特征变化的挑战,并探索了图像裁剪、调整大小、对比度调整、归一化和数据增强等技术来优化特征提取和改善视网膜图像的整体质量。此外,除了检测和诊断,本研究还深入研究了将机器学习算法应用于预测 DR 发展的风险或疾病进展的可能性。使用包含人口信息、病史和视网膜图像的全面患者数据生成个体化风险评分。该提出的半监督图学习算法在两个公开数据集上进行了严格评估,并与现有方法进行了基准测试。结果表明,在分类准确性、特异性和灵敏度方面取得了显著的改进,同时表现出对噪声和异常值的鲁棒性。值得注意的是,该算法解决了医学图像分析中常见的不平衡数据集的挑战,进一步增强了其实际适用性。
Sep, 2023