人脸识别中的魔鬼在于噪音
本文演示如何使用深度卷积神经网络 (DCNN) 从嘈杂的标签中学习,并以面部表情识别为例。通过比较多数投票,多标签学习,概率标签绘制和交叉熵损失四种方法来利用多个标签,我们发现传统的多数投票方案表现不如完全利用标签分布的最后两种方法。此外,我们还向研究社区共享了一组多标签面部图像数据集。
Aug, 2016
本文研究了深度卷积网络在人脸识别中的性能,发现网络的 “瓶颈” 结构对于迁移学习具有重要作用,并提出了一种解决方法,即用自助法取代随机子采样;同时还发现了表示范数和目标域判别能力之间的联系,并基于这些发现,在目前最流行的人脸识别数据集 LFW 上取得了优秀的性能,甚至超越了商用系统。
Jun, 2014
采用合成数据集进行人脸识别,通过数据扩充和精细控制属性可以显著减少真实与合成数据集之间的差异,并降低数据集的偏见和标签噪声问题,从而将识别错误率从 91.93% 降低到 96.17%,并在较少的真实样本上训练可与百万真实样本训练相媲美的识别效果。
Oct, 2022
本论文探讨了人脸识别方面的几个问题,例如如何在图像和视频里训练系统、深度数据集是否比宽度数据集更好、添加标签噪音是否可以提高深度神经网络性能以及对齐是否对于人脸识别必须。作者在 CASIA-WebFace、UMDFaces 和新的视频数据集上训练了 CNN,并在 YouTube-Faces、IJB-A 和 UMDFaces 的不相交部分上测试。他们的新数据集包括 22,075 个视频和 3,735,476 个人工注释的帧。
May, 2017
本文介绍了使用合成人脸图像的方法解决现实世界人脸识别中困难的问题,并提出了 SynFace,探讨了训练人工合成和真实图像的最新人脸识别模型之间的性能差距及其原因,并提出了 identity mixup 和 domain mixup 方法来缓解性能差距。此外,对于人工合成的图像,本文还对姿态,表情,光照等因素进行了实验分析,提供了几种有效利用合成数据进行人脸识别的方法。
Aug, 2021
本文通过对亿万级别的图片进行大规模的人脸识别实验,发现使用深度学习进行的人脸识别系统对于训练数据中的个体识别的准确率要高于其他个体,而目前的大规模人脸识别数据集的个人隐私意识缺失,对隐私造成了严重影响。
Jan, 2020
本研究证明,基于深度神经网络的图像分类模型可以从含有数量远多于准确标签的训练数据中进行有效学习,表现出良好的测试性能提升,这种学习需要增加数据集大小作为代价。
May, 2017
该论文提出了一种基于无标签干扰数据集训练深度卷积神经网络的新型框架,并使用一个无向图模型来描述干净和嘈杂标签之间的关系,在监督学习过程中学习这个模型。该模型在图像标注问题上应用,并在 CIFAR-10 和 MS COCO 数据集上展示出有效的标注效果和在训练中实现了减少标签噪声的效果。
May, 2017
本文通过使用野生标记人脸数据集(LFW), 系统地研究了四种不同的深度卷积神经网络模型在面部识别任务中对图像质量、颜色信息、CNN 架构和描述符计算等不同协变量因素的影响,结果发现高噪声、模糊、缺失像素以及亮度对所有模型的识别准确性有不利影响,而对比度变化和压缩失真的影响有限,但同时发现描述符计算和颜色信息对性能没有显著影响,这对未来深度学习模型的进一步优化和改进提供了启示。
Oct, 2017