ICCVOct, 2023

从图书中构建图像与文本对数据集

TL;DR利用数字档案进行机器学习的新方法,通过光学字符阅读器(OCR)、物体检测器和布局分析器构建数据集,展示其在图像 - 文本检索和洞察力提取方面的有效性。