如何选择预训练的手写识别模型用于单作者微调
本文提出一种无监督的写手适应方法,使用合成字体完全训练出的识别器自动适应新的入职写手,从而提供了一种实用且通用的方法来处理新的文档收集,而不需要任何昂贵和繁琐的手动注释步骤。
Sep, 2019
本研究主要解决将手写文本识别能力添加到大规模多语言 OCR 系统中的难点,包括数据获取,效率和集成等三个方面,通过使用在线手写数据集和基于神经网络的线识别模型等方式解决了这些问题,实现了 HTR 能力在 OCR 系统中的集成。
Apr, 2019
本文提出了一种新颖的元学习框架,该框架可以在推理过程中通过支持集合利用额外的新作者数据并通过单个梯度步更新输出作者自适应模型,这个模型可以在最先进的 HTR 模型之上轻松实现,并且可以在极少的新风格数据下实现平均 5-7% 的性能提升。
Apr, 2021
手写识别中,深度学习取得了显著成就。然而,神经网络在处理数据分布转变时存在问题。本文讨论如何使手写识别模型能够自适应不同风格的书写,通过使用少量新人笔迹的例子进行适应。通过两种基本模型以及模型无关元学习和作家代码两种方法,实验结果表明 MetaHTR 在适应性上优于基准模型,提高了 1.4 到 2.0 的词错误率,并且深层模型适应性好于浅层模型。然而,MetaHTR 在更大模型或句子级别的手写识别中的计算和内存需求可能变得不切实际,而基于学习特征或 Hinge 统计特征的作家代码并未提高识别性能。
Jul, 2023
这篇论文介绍了在应用阶段中评估手写文本识别 (HTR) 模型所面临的问题,以及介绍了使用不依赖于地面真实文本数据的指标来选择最佳模型的方法,其中包括使用标准语言模型和遮盖语言模型 (MLM) 的复杂度更高的方法,并表明 MLM 评估可以与基于词典的方法相竞争,其优点在于大型和多语言 Transformer 是随时可以使用的。
Jan, 2022
本文探讨了在合成单词图像上进行大规模预训练,以提高四项基准笔迹分析任务的性能。作者利用全监督目标对简单的卷积神经网络进行训练,得到编码笔迹风格的图像向量表示,进而实现了笔迹风格的作者检索、鉴别、验证、分类任务,并展示了该预训练策略提取了作者风格的丰富表征,可以在这些任务中得到与任务特定的最先进方法相竞争的结果。
Apr, 2023
研究了手写体文本生成的影响因素,提出了输入准备和训练规范化策略,以获得更好的性能和更好的泛化能力,并提出了手写体文本生成的评估协议的标准化和全面的对比分析,推动该领域的进展。
Feb, 2024
本文研究了多种训练模型的方式来识别手写文本,特别是在存在多个不完整或有噪声的转录版本时,考虑了不同的训练配置和数据选择方法,并在法国贝尔福市的城市登记册上进行了实验,结果表明,计算共识转录或基于多个转录进行训练是有希望的替代方案,但基于注释者之间的一致程度选择训练样本会引入偏差并不能提高结果。
Jun, 2023
通过引入与文本进行比较的任务,我们提出了一个无限制的二元分类器,其中包括一个手写识别特征提取器和一个多模态分类头,该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明,与直接使用最先进的手写识别模型来解决任务相比,尽管保持高回收率,但分类器可以进行校准,使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。
Sep, 2023