Jun, 2024

工业语言图像数据集(ILID):为工业场景调整视觉基础模型

TL;DR我们介绍了一种基于网络爬取数据的工业语言图像数据集(Industrial Language-Image Dataset)的生成流程,并展示了有效的自监督迁移学习方法,以及在这个廉价获取的数据集上进行训练后的下游任务讨论(不需要人工标注或干预),从而将现有的基础模型、迁移学习策略和应用方法转移到工业领域。