Mar, 2025

一种令人沮丧却极其有效的攻击基准:对GPT-4.5/4o/o1强大的黑箱模型成功率超过90%

TL;DR本研究解决了针对商业黑箱大规模视觉语言模型(LVLMs)转移式目标攻击失败的问题,指出常规扰动缺乏语义细节。提出的新方法通过在局部区域编码明确的语义信息,显著提高了攻击的有效性,在对GPT-4.5、4o和o1等商业LVLMs的攻击中成功率超过90%。