Jun, 2017

使用多模态全卷积神经网络学习从文档中提取语义结构

TL;DR该研究提出了一种全卷积网络,通过多模态方法从文档图像中提取语义结构,并使用像素级分割方式考虑文档的语义结构提取。该方法不仅考虑文本的视觉外观,还考虑文本的内容,通过有效的合成文档生成数据进行预训练和半监督学习方法滴定优化网络架构,施加于真实文档上,此方法极大地提高了分割的性能表现。