Apr, 2024

混合低秩专家用于可传输的人工智能生成图像检测

TL;DR通过开发通用的人工智能生成图像检测器,该研究旨在识别不同来源的图像。该方法通过深入挖掘 CLIP-ViT 的潜力并保留知识,扩展可传递检测的能力,提出了一种新颖的参数高效的微调方法,使用低秩专家的混合模式在 MoE 结构中融合共享和分离的 LoRAs。通过在公共基准测试中进行大量实验,我们的方法在跨生成器泛化和对扰动的鲁棒性方面实现了超越最先进方法的优越性。值得注意的是,我们表现最佳的 ViT-L/14 变体只需训练其 0.08% 的参数即可将最领先的基线提高 + 3.64% 的 mAP 和 + 12.72% 的平均准确率,超越了仅使用训练数据的 0.28% 的基线。