Sep, 2024

面向大型视觉语言模型的跨语言艺术作品解释

TL;DR本研究针对大型视觉语言模型(LVLMs)在生成非英语解释时的局限性,提出了一种新的多语言扩展数据集,避免了机器翻译带来的文化偏见问题。研究发现,LVLMs在其他语言上的表现优于英语,并且难以有效利用从英语数据中学习的知识,强调了在多语言环境下进一步优化模型的必要性。