Sep, 2024

大型视觉语言模型是否掌握了艺术史?

TL;DR本研究探讨了大型视觉语言模型(VLMs)在艺术作品分类,特别是绘画风格分类中的表现,这一领域通常由艺术史学家主导。通过分析四种VLMs并利用两个公共艺术作品基准,我们发现这些模型在艺术风格、作者和时期的零样本分类中表现出一定的能力,推动了艺术作品分类的研究进展。