CVPRApr, 2020
具有复杂布局的历史日本文件大型数据集
A Large Dataset of Historical Japanese Documents with Complex Layouts
Zejiang Shen, Kaixuan Zhang, Melissa Dell
TL;DR本文介绍了一种使用 HJDataset 的深度学习方法,可以准确地分析历史日文文档的布局并提取内容。该数据集包含 250,000 多个布局元素注释和基于半规则的方法构建,旨在提供深度学习模型的基准性能分析。