Mar, 2024
细调的多模态语言模型是高质量的图像文本数据过滤器
Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters
Weizhi Wang, Khalil Mrini, Linjie Yang, Sateesh Kumar, Yu Tian...
TL;DR通过细调多模式语言模型,进行图像文本数据的过滤,设计了四个综合衡量图像文本数据质量的度量标准,并建立了一个新的流水线用于构建高质量指导数据,以提高预训练模型性能。在不同模型和任务上,与传统方法相比,我们的多模式语言模型过滤器取得了显著的改进效果。