BriefGPT.xyz
Ask
alpha
关键词
llava-style vlm
搜索结果 - 1
LLaVA 视觉语言模型为何回复英文图像?
我们发现一种意外的多语言偏差存在于一类流行的多模态视觉语言模型(VLMs)中。将图像包含在 LLaVA 风格的 VLM 查询中,无论查询的语言如何,模型返回英文响应的可能性显着增加。本文通过对设计空间进行广泛剔除和模型对图像和文本输入进行机
→
PDF
8 days ago
Prev
Next