ICLRJan, 2024
用冗长图像引发大型视觉语言模型的高能耗延迟
Inducing High Energy-Latency of Large Vision-Language Models with Verbose Images
Kuofeng Gao, Yang Bai, Jindong Gu, Shu-Tao Xia, Philip Torr...
TL;DR通过制造细微的扰动来诱导大型视觉 - 语言模型在推理过程中生成较长的句子,从而提高了生成长度和时间成本,造成能源和计算资源的枯竭。