CVPRDec, 2021

一种视觉语言式的通用人脸表征学习方法

TL;DR本研究提出了一种通用的人脸表示学习框架(FaRL),其使用对比损失和掩蔽图像建模来同时掌握高层语义和低层信息。在大量的图像和文本对上进行预训练并在多个下游任务中验证其性能,在人脸解析和人脸对齐等人脸分析任务中展现了比以往预训练模型更好的迁移表现。