CVPRApr, 2020

具有复杂布局的历史日本文件大型数据集

TL;DR本文介绍了一种使用 HJDataset 的深度学习方法,可以准确地分析历史日文文档的布局并提取内容。该数据集包含 250,000 多个布局元素注释和基于半规则的方法构建,旨在提供深度学习模型的基准性能分析。