LFFD:一款适用于边缘设备的轻量快速人脸检测器
本研究提出了一种轻量且准确的面部检测算法 LAFD(基于 Retinaface)。该算法中的主干网络是修改的 MobileNetV3 网络,调整了卷积核的大小、反向残差块的通道扩展乘数以及 SE 注意机制的使用。在上下文模块中引入了可变形卷积网络(DCN),并使用焦点损失函数作为模型的分类损失函数,而不是交叉熵损失函数。在 WIDERFACE 数据集上的测试结果表明,LAFD 的平均准确率分别为 94.1%,92.2%和 82.1%,对应于 “easy”,“medium” 和 “hard” 验证子集,相对于 Retinaface 分别提高了 3.4%,4.0%和 8.3%,相对于轻量级模型 LFFD 分别提高了 3.1%,4.1%和 4.1%。如果将输入图像预处理并缩放到 1560 像素的长度或 1200 像素的宽度,该模型在 “hard” 验证子集上可以达到 86.2%的平均准确率。该模型很轻量,仅有 10.2MB 的大小。
Aug, 2023
该论文提出了一种名为 CenterFace 的一阶段方法,可在有限的存储空间和低计算能力的边缘设备上以实时速度和高精度同时预测面部框和地标位置,其可以优秀地应用于人脸检测和对齐等场景。
Nov, 2019
本文提出了一种定制的轻量级背骨网络 (BLite) 和一种轻量级人脸检测器 (FDLite),采用常用的损失函数和学习策略进行训练,并在 WIDER FACE 验证数据集的不同子集上分别达到了 92.3%、89.8% 和 82.2% 的平均准确率 (AP)。
Jun, 2024
本文利用加速技术,设计了一个紧凑的人脸特征点检测模型,在不同的自然环境下,如不受限制的姿态、表情、光照和遮挡,取得了很高的检测精度和超快的速度,通过旋转信息的估计进行几何规范化特征定位,同时还采用不同样本权重的一种新误差函数,用于平衡数据不均衡的问题,并在多个面部特征检测数据集上表现出卓越的性能。
Feb, 2019
本文介绍了一种名为 Single Shot Scale-invariant Face Detector 的实时人脸检测器,它通过单个深度神经网络在各种尺度的人脸上表现出色,特别是对小尺寸的人脸有良好的检测效果。我们在提出一个尺度平等的人脸检测框架、通过尺度补偿锚匹配策略和最大化背景标签的方式来提高小尺寸人脸的召回率和减少假阳性率。通过 AFW、PASCAL face、FDDB 和 WIDER FACE 数据集的评测结果,该方法达到了当今最先进的检测性能,并可在 Nvidia Titan X (Pascal) 上为 VGA 分辨率图像提供 36 FPS 的响应速度。
Aug, 2017
自主空中收获是一个高度复杂的问题,因为它需要在小型低功耗计算设备上执行许多交叉学科算法。本文提出了一种基于新型潜在对象表示 (LOR) 模块、查询分配和预测策略的资源高效、单阶段且无后处理的快速水果检测器 (FFD),实现了与控制、抓取、SLAM 等时间关键子系统同时存在的 10W 技嘉 Jetson-NX 嵌入式设备上的 100FPS@FP32 精度,是本工作的一个重大成就。此外,本文还提出了一种在无需详尽手动标记水果图像的情况下生成大量训练数据的方法,因为这些图像包含大量的实例,从而增加了标记成本和时间;同时还创建了开源水果检测数据集,其中有许多很难检测到的非常小的实例。对我们的数据集和 MinneApple 数据集进行的详尽评估表明,FFD 作为一个单尺度检测器比许多代表性检测器更准确,例如,与单尺度 Faster-RCNN 相比,FFD 的 AP 提高了 10.7,与多尺度 Faster-RCNN 相比提高了 2.3,与最新的单尺度 YOLO-v8 相比提高了 8,与多尺度 YOLO-v8 相比提高了 0.3,同时运行速度显著更快。
Feb, 2024
本文提出了一种基于锚点的深度人脸检测器,通过在 hard images 上学习 small faces,并采用新型的 hard image mining 训练方法,在 WIDER FACE、FDDB、Pascal Faces 和 AFW 数据集上进行了实验,证明了该方法对 hard faces 检测的有效性。
Nov, 2018
利用深度学习技术提高了 faster RCNN 的性能,实现人脸检测领域的最新技术并在 FDDB 数据集上表现出优异的 ROC 曲线。
Jan, 2017
本文提出了一种名为 FDNet1.0 的面部检测详细设计的 Faster RCNN 方法,通过多尺度训练、多尺度测试、轻量级 RCNN、推理技巧和基于投票的集成方法,实现了在 WIDER FACE 验证数据集(易于设置、中等设置、困难设置)三项任务中的两个第一名和一个第二名。
Feb, 2018
本文介绍了 EdgeFace,这是一种轻量级高效的人脸识别网络,它结合了 CNN 和 Transformer 模型的优势,使用低秩线性层优化了计算性能,适用于边缘设备,并在多个领域取得了理想的人脸识别结果。
Jul, 2023