Mar, 2024

拼贴提示:经济实惠的视觉识别与 GPT-4V

TL;DR我们的研究引入了拼贴提示,一种预算友好的提示方法,在 GPT-4V 上实现了多张图像的同时图像识别,并通过优化图像排列以达到最大的识别准确性,实验证明拼贴提示在成本效益上明显优于标准提示,并且学习的排列方式明显比随机排列在 GPT-4V 的视觉识别中更准确。