人脸识别中的魔鬼在于噪音

ECCVJul, 2018

The Devil of Face Recognition is in the Noise

Fei Wang, Liren Chen, Cheng Li, Shiyao Huang, Yanjie Chen...

TL;DR本研究通过清洗常用人脸数据库数据集，建立一组新的大规模 IMDb-Face 数据集，对 MegaFace 及 MS-Celeb-1M 数据集进行噪声分析，并探究标签噪声与人脸识别模型准确性之间的关联，提出改进数据准确性的方法，包括用户研究数据标注的影响。

Abstract

The growing scale of face recognition datasets empowers us to train strong convolutional networks for →

face recognition convolutional networks label noise datasets data labeling

发现论文，激发创造

用于训练人脸识别 CNN 的噪声容忍模式

使用加权样本的训练范式，基于角边缘损失函数训练深度卷积神经网络模型既可消除噪声数据效应，又可以在大规模人脸识别数据集上实现高精度识别。

Mar, 2019

利用众包标签分布训练面部表情识别的深度网络

本文演示如何使用深度卷积神经网络 (DCNN) 从嘈杂的标签中学习，并以面部表情识别为例。通过比较多数投票，多标签学习，概率标签绘制和交叉熵损失四种方法来利用多个标签，我们发现传统的多数投票方案表现不如完全利用标签分布的最后两种方法。此外，我们还向研究社区共享了一组多标签面部图像数据集。

Aug, 2016

人脸识别的 Web 规模训练

本文研究了深度卷积网络在人脸识别中的性能，发现网络的 “瓶颈” 结构对于迁移学习具有重要作用，并提出了一种解决方法，即用自助法取代随机子采样；同时还发现了表示范数和目标域判别能力之间的联系，并基于这些发现，在目前最流行的人脸识别数据集 LFW 上取得了优秀的性能，甚至超越了商用系统。

Jun, 2014

DigiFace-1M: 100 万数字人脸图像用于人脸识别

采用合成数据集进行人脸识别，通过数据扩充和精细控制属性可以显著减少真实与合成数据集之间的差异，并降低数据集的偏见和标签噪声问题，从而将识别错误率从 91.93% 降低到 96.17%，并在较少的真实样本上训练可与百万真实样本训练相媲美的识别效果。

Oct, 2022

基于 CNN 的人脸验证的注意事项

本论文探讨了人脸识别方面的几个问题，例如如何在图像和视频里训练系统、深度数据集是否比宽度数据集更好、添加标签噪音是否可以提高深度神经网络性能以及对齐是否对于人脸识别必须。作者在 CASIA-WebFace、UMDFaces 和新的视频数据集上训练了 CNN，并在 YouTube-Faces、IJB-A 和 UMDFaces 的不相交部分上测试。他们的新数据集包括 22,075 个视频和 3,735,476 个人工注释的帧。

May, 2017

SynFace: 用合成数据进行人脸识别

本文介绍了使用合成人脸图像的方法解决现实世界人脸识别中困难的问题，并提出了 SynFace，探讨了训练人工合成和真实图像的最新人脸识别模型之间的性能差距及其原因，并提出了 identity mixup 和 domain mixup 方法来缓解性能差距。此外，对于人工合成的图像，本文还对姿态，表情，光照等因素进行了实验分析，提供了几种有效利用合成数据进行人脸识别的方法。

Aug, 2021

探究在人脸识别训练数据中包含信息对个体人脸识别的影响

本文通过对亿万级别的图片进行大规模的人脸识别实验，发现使用深度学习进行的人脸识别系统对于训练数据中的个体识别的准确率要高于其他个体，而目前的大规模人脸识别数据集的个人隐私意识缺失，对隐私造成了严重影响。

Jan, 2020

深度学习对大规模标签噪声具有强韧性

本研究证明，基于深度神经网络的图像分类模型可以从含有数量远多于准确标签的训练数据中进行有效学习，表现出良好的测试性能提升，这种学习需要增加数据集大小作为代价。

May, 2017

训练深度判别神经网络对抗标签噪声的鲁棒性

该论文提出了一种基于无标签干扰数据集训练深度卷积神经网络的新型框架，并使用一个无向图模型来描述干净和嘈杂标签之间的关系，在监督学习过程中学习这个模型。该模型在图像标注问题上应用，并在 CIFAR-10 和 MS COCO 数据集上展示出有效的标注效果和在训练中实现了减少标签噪声的效果。

May, 2017

深度学习模型对抗图像退化下的人脸识别优势和劣势

本文通过使用野生标记人脸数据集（LFW）, 系统地研究了四种不同的深度卷积神经网络模型在面部识别任务中对图像质量、颜色信息、CNN 架构和描述符计算等不同协变量因素的影响，结果发现高噪声、模糊、缺失像素以及亮度对所有模型的识别准确性有不利影响，而对比度变化和压缩失真的影响有限，但同时发现描述符计算和颜色信息对性能没有显著影响，这对未来深度学习模型的进一步优化和改进提供了启示。

Oct, 2017