面向 Flops 受限的人脸识别
研究通过有效的神经模型 $f$ 进行面部验证的问题。该模型的高效性源于将面部验证问题简化为二进制问题,并且每个用户都有自己的神经网络 $f$。为了在训练集中实现不同个体之间的信息共享,我们并未直接训练 $f$,而是使用超网络 $h$ 生成模型权重。该方法生成了一种紧凑的个性化面部识别模型,可部署在边缘设备上。该方法的关键在于创造性地生成困难样本并精心安排训练目标。我们的模型仅需 23k 参数和 5M 浮点运算(FLOPS),并且使用六个面部验证数据集证明我们的方法与最先进的模型相媲美或更好,同时参数数量和计算负荷显著减少。此外,我们进行了广泛的剔除研究以证明我们方法中每个元素的重要性。
Dec, 2023
基于 FLOP 的高效目标检测计算的神经网络架构设计选择和优化方法,LeYOLO 提供了在不同资源限制下性能优越的计算负载和准确率比例。
Jun, 2024
本文在人脸识别任务中探讨了卷积神经网络 (convolutional neural network) 的应用,提出了一种名为 Li-ArcFace 的新的损失函数 (loss function), 并在 MobileFaceNet 这一网络架构上进行了改进及添加注意力机制,同时总结出一些在人脸识别训练中的有用技巧,并在 LFR2019 深光科技挑战赛中荣获第二名。
Jul, 2019
针对面部验证应用所需要效率极高和吞吐量大的需求,本文提出了基于混合深度卷积核的一组极其高效的深度学习模型 MixFaceNets,在多个数据集中对模型进行了评估,结果表明在计算复杂度相同的情况下,MixFaceNets 在所有的数据集上性能优于 MobileFaceNets,同时在计算复杂性在 500M 和 1G FLOPs 之间时,我们 MixFaceNets 的结果与排名前几位的模型相当,同时使用的 FLOPs 更少,验证了我们提出的 MixFaceNets 的实用价值。
Jul, 2021
本研究通过探索多种快速卷积算法,包括 Winograd 和 FFT,并发现了一种将它们应用于不同类型卷积的最佳策略;实现在基于高级综合的可配置 IP 人脸识别加速系统中使用 FaceNet,并利用并行化的优化方案在新型 CNN 体系结构上,实现比高端 NVIDIA GPU 快 3.75 倍的延迟加速,并显著超过先前的 FPGA 结果。
Mar, 2018
本文介绍了 MicroNet,一种高效的卷积神经网络,利用极低的计算成本(例如,在 ImageNet 分类中为 6 MFLOPs)。这种低成本网络在边缘设备上非常受欢迎,但通常会遭受显著的性能下降。我们提出了 Micro-Factorized 卷积和 Dynamic Shift-Max 激活函数两个设计原则,为构建性能显著优于现有最佳法在低 FLOP 区间的 MicroNets 打下基础,例如,MicroNet-M1 在 ImageNet 分类中以 12 MFLOPs 为 6.1%,超过 MobileNetV3 的 11.3%。
Nov, 2020
神经网络的计算需求逐渐增加,同时对资源有限的设备提出了部署挑战。网络剪枝是在保持性能的同时减小模型大小和计算成本的解决方案。本文提出了 FALCON,一种基于组合优化的网络剪枝框架,同时考虑了模型准确性、FLOPs 和稀疏性约束。我们的算法可以解决含有数百万参数的问题实例,并证明在固定 FLOP 预算下,FALCON 相比其他剪枝方法具有更高的准确性。此外,在逐步剪枝设置中,我们的框架表现优于现有的剪枝方法,强调了对有效网络剪枝而言,结合 FLOP 和稀疏性约束的重要性。
Mar, 2024
本文提出了一种定制的轻量级背骨网络 (BLite) 和一种轻量级人脸检测器 (FDLite),采用常用的损失函数和学习策略进行训练,并在 WIDER FACE 验证数据集的不同子集上分别达到了 92.3%、89.8% 和 82.2% 的平均准确率 (AP)。
Jun, 2024
通过提出局部卷积 (PConv) 和一种新的神经网络 FasterNet,实现了在广泛设备上获得比其他网络更快的运行速度,而不会牺牲各种视觉任务的准确性。
Mar, 2023