Sep, 2023

VDC:通过视觉 - 语言不一致性检测脏数据样本的多功能数据清洗器

TL;DR通过使用多模态的大型语言模型,本研究提出了一种名为 VDC 的多功能数据清洗器,用于检测数据集中的污染样本,特别关注图像和相关标签之间的语义不一致性,实验证明其在各种类型的污染样本上具有卓越的性能和推广能力。