Faceptor:面部感知的通用模型
我们介绍了 FaceXformer,这是一个端到端的统一变换器模型,用于综合范围的面部分析任务,如面部解析、标志检测、头部姿势估计、属性识别以及年龄、性别、种族和标志点可见性的估计。我们的 FaceXformer 利用基于变换器的编码器 - 解码器架构,将每个任务视为可学习的标记,从而在单一框架内集成多个任务。此外,我们提出了一个参数高效的解码器 FaceX,它共同处理面部和任务标记,从而在不同任务之间学习通用和鲁棒的面部表示。根据我们的了解,这是首次使用变换器提出了一个能够处理所有这些面部分析任务的单一模型。我们对统一面部任务处理的有效骨干进行了全面分析,并评估了不同任务查询和它们之间的协同作用。我们在多个基准测试中进行了对比实验证实,与最先进的专用模型和之前的多任务模型相比,在数据集内和跨数据集评估中,我们的模型均表现出色。此外,我们的模型有效处理来自 “野外” 的图像,展示了它在八个不同任务上的鲁棒性和普适性,同时保持了每秒 37 帧的实时性能。
Mar, 2024
FaceX 是一种新颖的面部通用模型,能够同时处理多样化的面部任务,通过 Facial Omni-Representation Decomposing (FORD) 实现对各种面部组件的无缝操作,并利用 StableDiffusion 的先验来增强生成质量和加速训练,在这基础上通过 Facial Omni-Representation Steering (FORS) 和 Facial Representation Controller (FRC) 实现对生成过程的有效控制。
Dec, 2023
提出了一种名为 Q-Face 的新型任务自适应多任务人脸分析方法,该方法能够同时执行多个面部分析任务,并在表情识别、动作单元检测、面部属性分析、年龄估计和面部姿态估计等方面达到了最先进的性能。
May, 2024
使用 Uni-Perceiver 的通用感知架构进行多个任务和多个模态的统一建模和共享参数,在预训练和微调的阶段都表现出了可接受的结果和表现。
Dec, 2021
我们提出了一种名为 UniHead 的创新检测头,同时统一了三种感知能力:变形感知、全局感知和跨任务交互,使得我们的方法在 COCO 数据集上显著改进了多个检测器的性能。
Sep, 2023
FaceCat 利用人脸生成模型作为预训练模型,通过精心设计的层次融合机制捕捉人脸生成模型的丰富结构和细节特征,为同时执行人脸反欺骗和对抗检测任务的轻量级头部提供稳定的基础。同时,通过特定文本引导的多模态对齐策略丰富特征表达,提高性能。FaceCat 在 28 种攻击类型的广泛实验中验证了其显著提高的泛化能力和对输入变换的优异鲁棒性。
Apr, 2024
该研究提出了一种基于单一的 Swin Transformer 的多功能算法,用于同时进行人脸识别、面部表情识别、年龄估计和面部属性估计,并通过多层级通道注意力模块适应性地选择最佳级别和通道上的特征,以提高预测准确性、数据效率和训练速度。
Aug, 2023
本文提出并实现了一种基于单个卷积神经网络的人脸识别方法,使用残差学习框架和归一化特征计算损失,实验证明在不同数据集上具有较好的泛化性能。
Mar, 2017
本研究提出了一种名为 GaTector 的新型框架,它使用了一个特定 - 通用 - 特定的特征提取器,并引入了能量聚合损失和 wUoC 度量标准,以在统一的框架下解决凝视目标预测问题。实验证明,该方法在目标检测、凝视估计和凝视对象预测三个任务中都具有优异的性能。
Dec, 2021
在这篇论文中,我们致力于解决野外人脸识别的挑战,其中图片常常存在质量低下和真实世界的扭曲。通过提出一种适用于基于高质量数据集上训练的现有人脸识别模型的有效适配器,我们旨在克服传统启发式方法在处理低质量图片时的无效性。
Dec, 2023