Jun, 2024

LLavaGuard: 基于 VLM 的视觉数据集整理与安全评估保护

TL;DR通过引入基于 VLM 的安全模型 LlavaGuard,我们设计了可用于评估视觉内容的安全性合规性的多功能框架。我们使用高质量的视觉数据集对 LlavaGuard 进行了调试,其中涵盖了广泛的安全分类工具以在上下文感知的安全风险中进行 VLM 的调整,进而为其提供全面的信息响应,包括安全评级、违反的安全类别和深入的解释,其灵活的分类系统使得 LlavaGuard 可以根据不同场景进行定制化。通过实验证明了 LlavaGuard 在复杂的真实应用中的能力,表现出超越 GPT-4 等基准模型的最新性能,同时提供了从 7B 到 34B 参数的检查点,公开提供我们的数据集和模型权重,邀请研究人员进一步探索和满足不同社区和环境的需求。