AAAIFeb, 2021

使用循环神经网络进行 PDF 文档鲁棒性转换

TL;DR本文提出了一种新的 PDF 文档结构恢复方法,使用递归神经网络处理低级 PDF 数据表示,具有更高的准确性和更详细的文档结构分辨率,同时避免了数据量和计算成本问题,为信息检索提供了一种新思路。