ICLRJan, 2024

用冗长图像引发大型视觉语言模型的高能耗延迟

TL;DR通过制造细微的扰动来诱导大型视觉 - 语言模型在推理过程中生成较长的句子,从而提高了生成长度和时间成本,造成能源和计算资源的枯竭。