识别垂直加法和减法的手写数学表达式
我们提出的智能检测网络在手写数学公式识别中利用物体检测技术,与传统编码器 - 解码器方法不同,能够精确检测符号和数字,优于其他网络在识别复杂手写数学表达式方面,对 HMER 领域具有潜在的宝贵贡献。
Nov, 2023
本文提出了一种基于编码器 - 解码器网络的数学公式识别方法,在网络中加入语法规则,将标记序列预测建模为树遍历过程,从而有效描述表达式的语法上下文,减轻了数学公式识别中的结构预测误差。实验结果表明,我们的方法在三个基准数据集上均取得了比现有方法更好的识别性能。同时,我们还创建了一个包含 10 万个手写数学表达式图像的大规模数据集,其源代码、新数据集和预训练模型也将公开。
Mar, 2022
本文提出一种高性能的手写数学表达式识别模型,采用比例增强和 drop attention 技术解决了二维结构数学表达式识别中尺度不稳定的问题,并使用基于注意力机制的编码器 - 解码器网络从中提取特征并生成预测结果。我们的方法在 CROHME 2014 和 CROHME 2016 两个公共数据集上取得了最先进的性能。
Jul, 2020
手写数学表达式识别中的语义交互学习方法通过构建基于统计符号共现概率的语义图,设计语义感知模块,优化 HMER 和 SIL 来提高模型对符号关系的理解,并在基准数据集上展示了较好的识别性能。
Aug, 2023
本文提出了利用 CROHME 数据库的在线手写数学表达式,通过局部和全局扭曲以及分解策略以生成形状和结构变化,使用深度学习模型, 结合卷积神经网络和基于注意力机制的编码器 - 解码器结构进行端到端的在线手写数学表达式识别,取得了具有竞争力的结果,并且产生的数据集已公开。
Jan, 2019
使用基于注意力机制的编码器 - 解码器模型和多尺度注意力模型,结合密集连接卷积网络来处理手写数学表达式识别并在 CROHME 竞赛任务中取得了显著结果,只使用了官方训练数据集。
Jan, 2018
介绍了 MathWriting 数据集,它是迄今为止最大的在线手写数学表达式数据集,包含 23 万人工书写样本和 40 万个合成样本。MathWriting 还可用于离线 HME 识别,并且比所有现有的离线 HME 数据集(如 IM2LATEX-100K)都要大。为了推进在线和离线 HME 识别的研究,引入了基于 MathWriting 数据的基准测试。
Apr, 2024
该论文提出了一种基于双向情况下的 Attention 汇聚的互相学习网络,该网络包括一个共享编码器和两个并行解码器(逆序解码器和正序解码器),并通过互相蒸馏实现增强,同时提出了一种 Attention 汇聚模块,以有效地整合多尺度关注力,从而在手写数学表达式识别中具有更好的识别精度。
Dec, 2021
手写数学表达式识别的关键问题是如何有效利用双向上下文信息,本文提出了 Mirror-Flipped Symbol Layout Tree 和 Bidirectional Asynchronous Training 结构,扩展了双向训练策略到树解码器,以更有效地训练与利用双向信息,同时介绍了 Shared Language Modeling 机制来提高模型的鲁棒性和泛化能力。通过广泛实验证明了该方法在 CROHME 2014、2016、2019 和 HME100K 数据集上取得了最新的最优结果。
Dec, 2023