Jun, 2024

构建中国文化的镜头:用于理解中国谐音绘画艺术的多模态数据集

TL;DR通过发布《谜语艺术数据集》,本文旨在促进大型视觉 - 语言模型(VLM)的发展,以更好地理解和解释具有文化特定内容的艺术,特别是扎根于中国传统文化的艺术。