Apr, 2024

MathNet:基于数据的印刷数学表达式识别方法

TL;DR我们提出了一种数据为中心的方法来克服印刷数学表达式识别中的问题,并呈现了令人信服的实验结果:我们的主要贡献是增强 LaTeX 规范化以将任何 LaTeX 数学表达式映射到一个规范形式。基于这个过程,我们开发了一个改进版的基准数据集 im2latex-100k,包含 30 种字体而不是一种。其次,我们引入了实际论文中提取的数学表达式数据集 realFormula。第三,我们开发了一个基于卷积视觉变换器的数学表达式识别模型 MathNet,在所有四个测试集(im2latex-100k,im2latexv2,realFormula 和 InftyMDB-1)上表现出优越的结果,比之前的最先进技术高出高达 88.3%。