使用合成训练数据实时检测 2D 工具关键点

Oct, 2022

使用合成训练数据实时检测 2D 工具关键点

Real-time Detection of 2D Tool Landmarks with Synthetic Training Data

Bram Vanherle, Jeroen Put, Nick Michiels, Frank Van Reeth

TL;DR提出了一种基于深度学习和合成数据的计算机视觉模型，采用先进的渲染技术和中介监督架构来解决合成数据在真实图像上精度下降的问题，模型可应用于不同工具的 2D 关键点检测。

Abstract

In this paper a deep learning architecture is presented that can, in real time, detect the 2D locations of certain landmarks of physical tools, such as a hammer or screwdriver. To avoid the labor of manual labeling, the network is trained on synthetically generated data. Training

deep learning computer vision synthetic data transfer learning keypoint detection

发现论文，激发创造

无限 3D 关键点：提升连续 2D 面部关键点检测

这篇论文主要探讨了人脸标记探测器的实际应用中存在的三个重要问题，并展示了如何通过特定的架构改进来提高其准确性和时间稳定性。

May, 2024

面部多域关键点检测的扩散模型合成数据方法

利用两阶段训练方法和合成配对数据集，在多个领域中实现了高质量的多领域人脸特征点检测，并优于现有方法。

Jan, 2024

基于观察者中心线框模型的 3D 解释器网络

本文提出了一种称为 3D Interpreter Networks (3D-INN) 的网络，该网络旨在从单个图像中提取 3D 对象的姿态和结构信息。该网络基于 2D-annotated 真实图像和合成 3D 数据进行训练，并通过中间表示关键点的热图连接真实和合成数据。实验表明，该系统在 2D 关键点估计和 3D 结构恢复方面表现良好。

Apr, 2018

单张图像 3D 解释器网络

本文提出了一种名为 3D Interpreter Network（3D-INN）的端到端框架，通过序贯估计 2D 关键点热图和 3D 物体结构，该网络主要依靠两项技术创新，即 Projection Layer 和关键点热图。通过在真实 2D 注释图像和合成 3D 数据上训练，3D-INN 在 2D 关键点估计和 3D 结构恢复上均取得了最先进的性能。

Apr, 2016

一次探测医学标志物

本文提出了一种名为 CC2D 的新型框架，用于医学图像中的一次性地标检测任务。该框架分为两个阶段：自监督学习（CC2D-SSL）和带伪标签训练（CC2D-TPL），具有较高的检测准确率。

Mar, 2021

基于位置地图数据的轻量级 3D 密集人脸关键点估计模型

通过未标定的 2D 图像在无监督的方式下重建 3D 面部，并针对稠密地标进行预测，该方法在模型大小和计算成本上优于现有方法，并在各种头部姿势和面部变化中展现了高效性。

Aug, 2023

FaceLift: 半监督的三维面部关键点定位

介绍了一种采用半监督学习方法，在没有 3D 地标数据集的情况下，通过直接提取（可见的）手工标记的 2D 地标，并确保更好的定义对齐，从而学习 3D 地标。该方法利用 3D 感知的生成对抗网络进行更好的多视角一致性学习，并利用实景多帧视频进行鲁棒的跨领域泛化。实证实验证明，该方法不仅在 2D-3D 地标之间实现了更好的定义对齐，还在 3DMM 标记和摄影测量基准数据集上优于其他监督学习的 3D 地标定位方法。

May, 2024

重新审视面部关键点检测：使用深度神经网络的高效方法

本研究旨在评估迁移学习模型，包括 MobileNetV2 和 NasNetMobile，以及自定义 CNN 体系结构，在模型大小、参数和推理时间方面开发高效的深度学习模型，并研究数据增强和微调对这些模型的影响。MobileNetV2 体系结构产生了最低的 RMSE 和推理时间，而以人工优化的 CNN 体系结构与 Auto Keras 调整的体系结构表现类似。

May, 2022

3D 照片的全自动标志地和面部分割

使用基于深度学习的方法，该研究发展和评估了一种自动化头影测量标注方法。该方法在三维面部立体摄影中实现了自动的标注，能够精确和一致地标记关键点，可用于大数据集的定量分析，诊断，随访和虚拟手术规划。

Sep, 2023

基于人体点云的三维特征点检测：一个基准和双级级联点变换器框架

本篇论文介绍了一种在人体点云上进行三维关键点检测的挑战，并提出了一种名为 Dual Cascade Point Transformer (D-CPT) 的模型，该模型通过级联的 Transformer 解码器逐步优化关键点，在本地区域使用 RefineNet 增强关键点坐标，通过在 HPoint103 和公共数据集 DHP19 上进行对比评估，验证了我们的 D-CPT 模型在关键点检测方面的显著性能优势，并表明将我们的 RefineNet 集成到现有方法中可以持续提高性能。

Jan, 2024