使用合成训练数据实时检测 2D 工具关键点
本文提出了一种称为 3D Interpreter Networks (3D-INN) 的网络,该网络旨在从单个图像中提取 3D 对象的姿态和结构信息。该网络基于 2D-annotated 真实图像和合成 3D 数据进行训练,并通过中间表示关键点的热图连接真实和合成数据。实验表明,该系统在 2D 关键点估计和 3D 结构恢复方面表现良好。
Apr, 2018
本文提出了一种名为 3D Interpreter Network(3D-INN)的端到端框架,通过序贯估计 2D 关键点热图和 3D 物体结构,该网络主要依靠两项技术创新,即 Projection Layer 和关键点热图。通过在真实 2D 注释图像和合成 3D 数据上训练,3D-INN 在 2D 关键点估计和 3D 结构恢复上均取得了最先进的性能。
Apr, 2016
本文提出了一种名为 CC2D 的新型框架,用于医学图像中的一次性地标检测任务。该框架分为两个阶段:自监督学习(CC2D-SSL)和带伪标签训练(CC2D-TPL),具有较高的检测准确率。
Mar, 2021
通过未标定的 2D 图像在无监督的方式下重建 3D 面部,并针对稠密地标进行预测,该方法在模型大小和计算成本上优于现有方法,并在各种头部姿势和面部变化中展现了高效性。
Aug, 2023
介绍了一种采用半监督学习方法,在没有 3D 地标数据集的情况下,通过直接提取(可见的)手工标记的 2D 地标,并确保更好的定义对齐,从而学习 3D 地标。该方法利用 3D 感知的生成对抗网络进行更好的多视角一致性学习,并利用实景多帧视频进行鲁棒的跨领域泛化。实证实验证明,该方法不仅在 2D-3D 地标之间实现了更好的定义对齐,还在 3DMM 标记和摄影测量基准数据集上优于其他监督学习的 3D 地标定位方法。
May, 2024
本研究旨在评估迁移学习模型,包括 MobileNetV2 和 NasNetMobile,以及自定义 CNN 体系结构,在模型大小、参数和推理时间方面开发高效的深度学习模型,并研究数据增强和微调对这些模型的影响。MobileNetV2 体系结构产生了最低的 RMSE 和推理时间,而以人工优化的 CNN 体系结构与 Auto Keras 调整的体系结构表现类似。
May, 2022
使用基于深度学习的方法,该研究发展和评估了一种自动化头影测量标注方法。该方法在三维面部立体摄影中实现了自动的标注,能够精确和一致地标记关键点,可用于大数据集的定量分析,诊断,随访和虚拟手术规划。
Sep, 2023
本篇论文介绍了一种在人体点云上进行三维关键点检测的挑战,并提出了一种名为 Dual Cascade Point Transformer (D-CPT) 的模型,该模型通过级联的 Transformer 解码器逐步优化关键点,在本地区域使用 RefineNet 增强关键点坐标,通过在 HPoint103 和公共数据集 DHP19 上进行对比评估,验证了我们的 D-CPT 模型在关键点检测方面的显著性能优势,并表明将我们的 RefineNet 集成到现有方法中可以持续提高性能。
Jan, 2024