CVPRDec, 2019

DDI-100: 文本检测和识别数据集

TL;DR本文提出了扭曲文档图像数据集(DDI-100),该数据集是基于 7000 张真实唯一的文档页面的合成数据集,包含超过 100000 个增强图像,标注信息包括文本和邮戳掩模、文本和字符边界框等,验证结果表明该数据集在文档分析等多种领域有很好的实用价值。