Dec, 2023

双向训练树形解码器用于手写数学表达式识别

TL;DR手写数学表达式识别的关键问题是如何有效利用双向上下文信息,本文提出了 Mirror-Flipped Symbol Layout Tree 和 Bidirectional Asynchronous Training 结构,扩展了双向训练策略到树解码器,以更有效地训练与利用双向信息,同时介绍了 Shared Language Modeling 机制来提高模型的鲁棒性和泛化能力。通过广泛实验证明了该方法在 CROHME 2014、2016、2019 和 HME100K 数据集上取得了最新的最优结果。