ECCVNov, 2019

基于先验的高分辨率分层语义分割在文档结构提取中的应用

TL;DR本研究基于层次语义分割网络,提出了一种基于先验模型的深层次 CNN 网络结构,用于高分辨率文档图像的结构提取,通过在文档图像中将其分成互相重叠的水平条带进行分割,本网络得到了优秀的效果,我们还新建了人工标注的文档表单数据集并在此数据集上进行实验,对比不同分割 baseline 方法证明了本网络算法在分层结构提取上的高效性。当前,此算法已用于 Adobe 的 AEM Forms,实现了纸质和 PDF 表单的自动转换为现代 HTML 表单。