Oct, 2022

科学表格格式和内容提取到 LaTeX

TL;DR本文提供了一种基于 Transformer 的科学表格结构和内容提取方法,能够解决 PDF 研究文档中存在的跨度单元格和公式等复杂因素,最终精确匹配表格结构和内容,并高效识别表格的各种特征。