评估用于耳部掩膜分割的新型 Mask-RCNN 架构
通过部分监督学习方法,我们设计了一种训练模型,在只有少数类别的实例标注数据下,通过可微分裁剪和只使用 Groundtruth box 的方法,取得了 COCO 部分监督分割测试集的最佳表现,并发现了强大的 mask-head 泛化效应。
Apr, 2021
基于生物特征的人类性别分类是计算机视觉领域的一个重要问题,本研究使用深度卷积神经网络模型对耳部图像进行自动性别分类,通过在 EarVN1.0 耳朵数据集上进行评估,准确率达到 93%。
Aug, 2023
本文提出了一种基于 ArcFace 工作、利用数据增强和 Multi-Task ArcFace 算法的全面训练流程,可识别戴口罩的人脸,同时还可以检测人们是否佩戴口罩。此方法大大提高了识别准确性,并在口罩使用分类方面达到了 99.78% 的平均准确度。
Apr, 2021
我们提出了一个简单、灵活、通用的物体实例分割框架。此方法名为 Mask R-CNN,通过在现有的边界框识别分支上添加一个预测对象掩模的分支,同时高效地检测图像中的物体并生成每个实例的高质量分割掩模。该方法简单易用,可快速训练,并且在 COCO 挑战赛的三个跟踪任务中均取得最佳结果,在实例分割、边界框目标检测和人体关键点检测方面均表现优异,是一个强大的基线模型。
Mar, 2017
本研究旨在评估迁移学习模型,包括 MobileNetV2 和 NasNetMobile,以及自定义 CNN 体系结构,在模型大小、参数和推理时间方面开发高效的深度学习模型,并研究数据增强和微调对这些模型的影响。MobileNetV2 体系结构产生了最低的 RMSE 和推理时间,而以人工优化的 CNN 体系结构与 Auto Keras 调整的体系结构表现类似。
May, 2022
本文研究了无约束耳辨识问题,并证明了当使用深度卷积神经网络模型进行耳辨识时领域适应的重要性。通过收集新的耳朵数据集,混合不同的深度卷积神经网络模型来进一步提高性能,分析了耳像质量对分类性能的影响。通过在 UERC 数据集上进行实验验证,实验结果表明,领域适应会带来显著的性能提升,并且图像质量对结果有影响。对不同数据集存在偏差的问题进行分析,结果表明耳辨识数据集之间存在较强的偏差。
Mar, 2018
本研究关注耳部生物特征识别,通过利用其独特特征来提高准确性、可靠性和实用性,并证明了耳部生物特征识别在克服面部表情和光照条件变化等局限性方面的有效性。通过数据预处理和增强等技术,我们的模型在 AMI 数据集上实现了 99.35% 的测试准确率,并在 EarNV1.0 数据集上实现了 98.1% 的测试准确率,展示了我们方法在基于耳部生物特征的个体识别方面的有效性。
May, 2024
本研究通过深度卷积神经网络方法和基于几何和外观特征的方法对耳部图像进行建模,以进行性别和年龄分类。我们利用了几何特征和外观方法的混合模型,其中一些知名的卷积神经网络模型包括 AlexNet、VGG-16、GoogLeNet 和 SqueezeNet。实验结果表明,采用外观的方法比基于几何的方法更有效,并且我们在性别分类中达到了 94%的精度,而在年龄分类中只达到了 52%的精度。
Jun, 2018
本文提出了一种基于遮挡和深度学习特征的可靠方法来解决口罩蒙面等遮挡因素下的人脸识别问题,并使用预训练的卷积神经网络提取眼睛和前额区域特征以及使用多层感知器分类识别。实验结果表明该方法有较高的识别性能。
May, 2021
通过 AI 技术的计算机视觉系统识别戴口罩人群的情感,提出了一个新的挑战。本研究提出了一种能够识别不同面具人群情感的面部情感识别系统,并采用了一种新的数据增强技术来改善模型的性能。通过对四种面具类型的每张面部图像进行训练,评估了四个卷积神经网络(Alexnet,Squeezenet,Resnet50 和 VGGFace2)的效果。实验结果显示,与单面具模式相比,我们的模型在多面具模式下的效果更好。其中,VGGFace2 网络在使用 JAFFE 数据集时的人员相关模式的准确率最高,为 97.82%,人员独立模式的准确率为 74.21%。然而,我们使用 UIBVFED 数据集评估了我们的模型。Resnet50 在人员相关模式下表现出了优越的性能,准确率分别为 73.68% 和 59.57%。此外,我们采用了精确度、敏感度、特异性、AUC、F1 值和混淆矩阵等指标来详细衡量我们系统的效率。此外,还使用了 LIME 算法来可视化 CNN 的决策策略。
Dec, 2023