Oct, 2024

音频是致命弱点:对音频大型多模态模型的红队测试

TL;DR本研究针对大型多模态模型(LMMs)在音频方面的安全性问题进行了深入探讨,填补了目前在音频 LMMs 安全性研究中的空白。通过对五种先进音频 LMMs 进行全面的红队测试,结果显示它们在处理有害音频问题时攻击成功率高达 69.14%。该研究揭示了音频 LMMs 在安全对齐方面的脆弱性及其潜在原因,具有重要的安全性研究价值。