Oct, 2022
科学表格格式和内容提取到 LaTeX
Tables to LaTeX: structure and content extraction from scientific tables
Pratik Kayal, Mrinal Anand, Harsh Desai, Mayank Singh
TL;DR本文提供了一种基于 Transformer 的科学表格结构和内容提取方法,能够解决 PDF 研究文档中存在的跨度单元格和公式等复杂因素,最终精确匹配表格结构和内容,并高效识别表格的各种特征。