Mar, 2025

众包、抓取还是生成?创建SEA-VL,面向东南亚的多文化视觉语言数据集

TL;DR本研究针对东南亚在视觉语言研究中的严重缺乏,提出了SEA-VL数据集,以高质量和文化相关的数据填补这一空白。通过结合众包、图像抓取和生成等多种方式,发现抓取图像在文化相关性方面效果佳且更具成本效益,同时揭示了生成图像在准确反映东南亚文化方面的局限性。该数据集将有效促进东南亚文化的可视化研究,推动包容性AI系统的发展。