BriefGPT.xyz
Ask
alpha
关键词
vision-language integration
搜索结果 - 1
PixLore:基于数据集的丰富图像标题生成方法
使用 PixLore 方法,通过在商用 GPU 上细调 BLIP-2 模型,利用 LoRa 方法,基于来自先进计算机视觉模型和 ChatGPT 的精心组装的数据集训练,解决了图像理解的复杂性问题,并证明了以较小规模模型的集合体可以在绝大部分
→
PDF
7 months ago
Prev
Next