- DenseSeg: 使用密集的图像到形状表示进行语义分割和关键点检测的联合学习
采用密集的几何形状表示,通过使用完全卷积的架构,我们提出了一种联合学习标记点和语义分割的方法,并证明其在困难的标记点检测任务中优于热图回归的先进方法,无需对标记点进行显式训练,在不需要重新训练的情况下可以添加新的标记点。
- 半监督地标检测中的自训练再思考:一种无选择的方法
自我训练(self-training)方法在处理确认偏倚问题上具有重要作用,但在地标检测领域应用时面临着自适应选择伪标签、确定样本选择阈值和选择自训练的困难等问题。为了解决这些问题,本文提出了自我训练地标检测(STLD)方法,使用任务学习计 - 基於回歸的眼睛特徵提取中的標準化有效性分數
我们提出了一种改进的地标有效性损失,通过归一化来提高准确度,并通过设定不准确性的边界来减少梯度对结果的影响。
- 领域内数据对于 X 射线图像中的地标检测在迁移学习中是否有益?
深度学习在医学影像分析方面具有潜力,但在这个应用领域中,大规模的公开数据集和标注可用性受到限制。本文通过一个系统研究来分析,在小规模领域内 x 光影像数据集的使用是否能够在地标检测方面相较于仅在大规模自然图像数据集上预训练模型时提供任何改进 - 腹腔镜肝切除术中术前至术中图像融合增强现实方法的客观比较
在腔镜肝切除手术中,增强现实是一种可视化模式,能够帮助医生在腔镜图像上投影肿瘤和嵌入在肝脏内的血管,通过将其映射到术中腔镜图像中,从而实现定位。该研究主要针对 2D 和 3D 标志物自动检测和标记,以及 3D-2D 配准任务进行深入探讨,并 - SAMv2: 统一的外观、语义和跨模态解剖嵌入学习框架
基于自我监督解剖嵌入(SAM)的 SAMv2 是一个统一的框架,通过学习外观、语义和跨模态的解剖嵌入,克服了医学图像分析中的挑战,提供了一种在基于标志点的医学图像分析任务中表现优异的方法。
- 基于轻量级超分辨率头部人体姿态估计的颅面标志检测再探
通过研究人体姿势估计(HPE)和头颅测量检测(CLD)之间的相似性,本文提出一种可靠的用于头颅测量检测性能改进的基准方法,并通过引入超分辨率模块和量化偏差的减少以进一步提升性能,在 MICCAI CLDetection2023 挑战中取得了 - 在混乱的现实场景中使用视觉变换增强地标检测
本研究提出了一种能够有效利用视觉 Transformer 的方法,通过精选和隔离图像中与遮挡物相对应的特定区域,以改进视觉地点识别中的地标检测问题,在拥挤的实际情境中显示了视觉 Transformer 的潜力,并证明了该方法的卓越准确性。
- 基于 Transformer 的地标检测:面向机器人辅助鼻气道插管
本文提出了一种基于变形 DeTR 和语义对齐匹配模块的基于 Transformer 的标志检测解决方案,用于检测机器辅助气道插管中的标志。实验结果表明我们的解决方案在检测准确性方面具有竞争力。
- 将图像配准问题构造为地标检测问题,以更好地表示临床相关性
将图像配准方法转化为地标检测问题,通过子样本的互评分析计算误差分布并使用公式(中值 + delta * 中值绝对偏差)得到阈值,实现了先前无法区分的配准算法的区分,并进一步评估算法的临床意义。
- EchoGLAD: 基于层次化图神经网络的心脏超声图左心室地标检测
通过介绍一种基于超声心动图的分层图神经网络(EchoGLAD),用于左心室标志点检测,本研究提出了一种多分辨率标志点检测的分层图表示学习框架,并通过多级损失引入了不同粒度的分层监督。在两个数据集上,我们的模型在内部分布和外部分布的情况下,均 - UOD: 解剖标志通用单次检测
提出了一种医疗图像领域自适应的单次学习里程碑检测框架(UOD),通过使用两个阶段的通用模型和领域特定模块,实现了多领域无标签数据的领域偏好适应,并在 X-ray 头,手和胸部三类不同解剖部位的公共数据集上获得了最先进的表现。
- PELE scores: 骨盆提取增强法用于骨盆 X 线特征点检测
该研究提出 PELvis Extraction(PELE)模块,利用 CT 中的 3D 解剖知识引导和很好地分离 PXRs 中的盆骨,从而消除软组织的影响,从而显著提高 PXRs 的地标检测准确性,并在几个基准度量上实现了最先进的性能。
- 无循环的再现:使用深度平衡模型实现稳定视频地标检测
本文提出了一种基于 Deep Equilibrium Model 的级联计算方法 --Landmark DEQ (LDEQ),在面部关键点检测上取得了最先进的性能,并针对视频数据集提出了 Recurrence without Recurre - 野外多视角引导学习
本文提出了使用非刚性 3D 神经先验结合深流技术从仅有两到三个非标定手持相机的视频中获取高保真的地标估计,只需少量人工标注便可达到与全监督方法相当的 2D 结果,以及其他现有方法不可能实现的 3D 重建。
- 使用视觉 Transformer 进行结肠镜标志检测
本文提出一种基于视觉转换网络的结肠镜标志检测算法,利用自适应伽马矫正保持一致的图像亮度,并比较视觉转换网络与 ResNet-101 和 ConvNext-B 等原型在标记检测方面的表现,结果显示该算法提高效率并取得了较高的准确率。
- 基于 ResNet 骨干网的 U-Net 服装关键点识别
利用基于热图的地标检测模型,在 2D RGB 服装图像上定位重要地标如边缘、角以及合适的内部区域。再结合地标检测模型和纹理展开等技术,我们能够在现代 3D 编辑软件中重建 3D 服装。我们采用了 U-net 架构与 ResNet 骨干网络构 - 通过分布对齐特征相似度实现自监督地标估计
本文介绍了一种 LEAD 方法,用于从未注释的类别特定图像集合中发现地标。通过采用两阶段训练方法,该方法增强了自监督学习中密集等变表示的学习,并在极度有限的注释数下提高了地标检测的性能,同时提高了跨尺度变化的泛化能力。
- 预训练等变特征改进了无监督地标发现
本文研究了关键点检测中使用的无监督学习方法,重点介绍了其不能生成等变中间卷积特征的问题,并提出了一种两步无监督方法,该方法通过首先学习强大的基于像素的特征,然后使用预训练的特征来通过传统的等变性方法学习关键点检测器。在多个挑战性的标志性检测 - 自监督学习放射学图像像素级解剖嵌入
Self-supervised Anatomical eMbedding (SAM) is introduced to extract semantic embeddings for imaging pixels with intrinsi