Mar, 2024

评估基于生成式的大型多模态模型与基于微调的视觉转换器在基于图像的安全应用中的功效

TL;DR研究了用于解决关键安全挑战的提示引擎 Gemini-pro 多模态模型和精调 ViT 模型的适用性和效果,发现 Gemini-pro 在准确性和可靠性方面存在明显差异,而精调的 ViT 模型在两个任务上表现出色,达到近乎完美的性能。