Mar, 2022

StyleBabel:艺术风格标记和字幕

TL;DR本研究提出了 StyleBabel 数据集,包括超过 135K 的数字艺术作品的自然语言标题和描述艺术风格的自由表单标签;通过一种基于 Grounded Theory 的迭代方法进行收集,使用 ALADIN 架构 + Visual Transformer (ViT) 和跨模态表示学习进行 fine-grained style 检索,从而实现了自由形式标记的生成、自然语言描述艺术风格以及精细化文本搜索等多样化的样式特征任务。