Mar, 2024

细调的多模态语言模型是高质量的图像文本数据过滤器

TL;DR通过细调多模式语言模型,进行图像文本数据的过滤,设计了四个综合衡量图像文本数据质量的度量标准,并建立了一个新的流水线用于构建高质量指导数据,以提高预训练模型性能。在不同模型和任务上,与传统方法相比,我们的多模式语言模型过滤器取得了显著的改进效果。