Dec, 2023

压缩与对齐:用人类知识筛选图像文本数据

TL;DR该研究通过采用人工智能算法对图像文本数据进行高质量压缩,并利用训练出的奖励模型作为人类般的裁判来过滤不对齐/低质量的图像文本对。