Dec, 2023

PixLore:基于数据集的丰富图像标题生成方法

TL;DR使用 PixLore 方法,通过在商用 GPU 上细调 BLIP-2 模型,利用 LoRa 方法,基于来自先进计算机视觉模型和 ChatGPT 的精心组装的数据集训练,解决了图像理解的复杂性问题,并证明了以较小规模模型的集合体可以在绝大部分评估中超越 GPT-4 和 Google Bard 等现有领先模型。