Faceptor：面部感知的通用模型

Mar, 2024

Faceptor: A Generalist Model for Face Perception

Lixiong Qin, Mei Wang, Xuannan Liu, Yuhang Zhang, Wei Deng...

TL;DR通过统一模型结构，采用 Naive Faceptor 和 Layer-Attention，提高面部感知任务的扩展性和应用效率。在 13 个面部感知数据集上进行联合训练，Faceptor 在面部地标定位、面部解析、年龄估计、表情识别、二进制属性分类和人脸识别方面取得了卓越的性能，同时对辅助监督学习也有显著的提升。

Abstract

With the comprehensive research conducted on various face analysis tasks, there is a growing interest among researchers to develop a unified approach to face perception. Existing methods mainly discuss unified representation and training, which lack →

face perception unified model structure naive faceptor layer-attention task extensibility

发现论文，激发创造

FaceXFormer：面部分析的统一 Transformer

我们介绍了 FaceXformer，这是一个端到端的统一变换器模型，用于综合范围的面部分析任务，如面部解析、标志检测、头部姿势估计、属性识别以及年龄、性别、种族和标志点可见性的估计。我们的 FaceXformer 利用基于变换器的编码器 - 解码器架构，将每个任务视为可学习的标记，从而在单一框架内集成多个任务。此外，我们提出了一个参数高效的解码器 FaceX，它共同处理面部和任务标记，从而在不同任务之间学习通用和鲁棒的面部表示。根据我们的了解，这是首次使用变换器提出了一个能够处理所有这些面部分析任务的单一模型。我们对统一面部任务处理的有效骨干进行了全面分析，并评估了不同任务查询和它们之间的协同作用。我们在多个基准测试中进行了对比实验证实，与最先进的专用模型和之前的多任务模型相比，在数据集内和跨数据集评估中，我们的模型均表现出色。此外，我们的模型有效处理来自 “野外” 的图像，展示了它在八个不同任务上的鲁棒性和普适性，同时保持了每秒 37 帧的实时性能。

Mar, 2024

通过学习统一的面部表示实现通用的面部识别系统

FaceX 是一种新颖的面部通用模型，能够同时处理多样化的面部任务，通过 Facial Omni-Representation Decomposing (FORD) 实现对各种面部组件的无缝操作，并利用 StableDiffusion 的先验来增强生成质量和加速训练，在这基础上通过 Facial Omni-Representation Steering (FORS) 和 Facial Representation Controller (FRC) 实现对生成过程的有效控制。

Dec, 2023

任务自适应的 Q-Face

提出了一种名为 Q-Face 的新型任务自适应多任务人脸分析方法，该方法能够同时执行多个面部分析任务，并在表情识别、动作单元检测、面部属性分析、年龄估计和面部姿态估计等方面达到了最先进的性能。

May, 2024

Uni-Perceiver: 通用感知的预训练统一架构，用于零样本和小样本任务

使用 Uni-Perceiver 的通用感知架构进行多个任务和多个模态的统一建模和共享参数，在预训练和微调的阶段都表现出了可接受的结果和表现。

Dec, 2021

UniHead：统一多感知检测算法

我们提出了一种名为 UniHead 的创新检测头，同时统一了三种感知能力：变形感知、全局感知和跨任务交互，使得我们的方法在 COCO 数据集上显著改进了多个检测器的性能。

Sep, 2023

FaceCat：利用统一的生成模型框架增强人脸识别安全性

FaceCat 利用人脸生成模型作为预训练模型，通过精心设计的层次融合机制捕捉人脸生成模型的丰富结构和细节特征，为同时执行人脸反欺骗和对抗检测任务的轻量级头部提供稳定的基础。同时，通过特定文本引导的多模态对齐策略丰富特征表达，提高性能。FaceCat 在 28 种攻击类型的广泛实验中验证了其显著提高的泛化能力和对输入变换的优异鲁棒性。

Apr, 2024

SwinFace: 一种用于人脸识别、表情识别、年龄估计和属性估计的多任务 Transformer

该研究提出了一种基于单一的 Swin Transformer 的多功能算法，用于同时进行人脸识别、面部表情识别、年龄估计和面部属性估计，并通过多层级通道注意力模块适应性地选择最佳级别和通道上的特征，以提高预测准确性、数据效率和训练速度。

Aug, 2023

DeepVisage：简单却具有强大的泛化能力的人脸识别技术

本文提出并实现了一种基于单个卷积神经网络的人脸识别方法，使用残差学习框架和归一化特征计算损失，实验证明在不同数据集上具有较好的泛化性能。

Mar, 2017

GaTector：注视物体预测的统一框架

本研究提出了一种名为 GaTector 的新型框架，它使用了一个特定 - 通用 - 特定的特征提取器，并引入了能量聚合损失和 wUoC 度量标准，以在统一的框架下解决凝视目标预测问题。实验证明，该方法在目标检测、凝视估计和凝视对象预测三个任务中都具有优异的性能。

Dec, 2021

野外人脸识别的有效适配器

在这篇论文中，我们致力于解决野外人脸识别的挑战，其中图片常常存在质量低下和真实世界的扭曲。通过提出一种适用于基于高质量数据集上训练的现有人脸识别模型的有效适配器，我们旨在克服传统启发式方法在处理低质量图片时的无效性。

Dec, 2023