Oct, 2022
LAION-5B: 用于训练下一代图像 - 文本模型的大规模开放数据集
LAION-5B: An open large-scale dataset for training next generation image-text models
Christoph Schuhmann, Romain Beaumont, Richard Vencu, Cade Gordon, Ross Wightman...
TL;DRLAION-5B 是一个包含了 58.5 亿组图像 - 文本对的数据集,许多基础的模型如 CLIP、GLIDE 和 Stable Diffusion 成功地使用了该数据集进行复现和微调,这个数据集的开放也将推动更多基于大规模多模型的研究。