Mar, 2024

CFPL-FAS: 无类别提示学习的通用人脸反欺骗

TL;DR利用大规模的 VLMs(如 CLIP)利用文本特征动态调整分类器权重,通过使用两个轻量级 Transformer(CQF 和 SQF)来学习基于内容和样式特征的不同语义提示,通过 Prompt Modulation(PM)设计,将学习到的文本特征调制到视觉特征上,以实现面向多领域的面部反欺诈模型的改进。