如何选择预训练的手写识别模型用于单作者微调

May, 2023

如何选择预训练的手写识别模型用于单作者微调

How to Choose Pretrained Handwriting Recognition Models for Single Writer Fine-Tuning

Vittorio Pippi, Silvia Cascianelli, Christopher Kermorvant, Rita Cucchiara

TL;DR通过对大型基准数据集和通过手写文本生成模型产生的合成数据集的研究，本文提出在大数据集上预训练手写文本识别模型，并在少量带有个人特点手写的小规模数据集上进行微调，以有效转录手稿。

Abstract

Recent advancements in deep learning-based handwritten text recognition (HTR) have led to models with remarkable performance on both modern and historical →

deep learning handwritten text recognition benchmark datasets fine-tuning manuscripts

发现论文，激发创造

用于合成至真实手写单词识别的无监督适应

本文提出一种无监督的写手适应方法，使用合成字体完全训练出的识别器自动适应新的入职写手，从而提供了一种实用且通用的方法来处理新的文档收集，而不需要任何昂贵和繁琐的手动注释步骤。

Sep, 2019

一个可扩展的手写文本识别系统

本研究主要解决将手写文本识别能力添加到大规模多语言 OCR 系统中的难点，包括数据获取，效率和集成等三个方面，通过使用在线手写数据集和基于神经网络的线识别模型等方式解决了这些问题，实现了 HTR 能力在 OCR 系统中的集成。

Apr, 2019

MetaHTR：面向作者自适应的手写文本识别

本文提出了一种新颖的元学习框架，该框架可以在推理过程中通过支持集合利用额外的新作者数据并通过单个梯度步更新输出作者自适应模型，这个模型可以在最先进的 HTR 模型之上轻松实现，并且可以在极少的新风格数据下实现平均 5-7% 的性能提升。

Apr, 2021

离线文本识别的作者适应性：基于神经网络方法的探索

手写识别中，深度学习取得了显著成就。然而，神经网络在处理数据分布转变时存在问题。本文讨论如何使手写识别模型能够自适应不同风格的书写，通过使用少量新人笔迹的例子进行适应。通过两种基本模型以及模型无关元学习和作家代码两种方法，实验结果表明 MetaHTR 在适应性上优于基准模型，提高了 1.4 到 2.0 的词错误率，并且深层模型适应性好于浅层模型。然而，MetaHTR 在更大模型或句子级别的手写识别中的计算和内存需求可能变得不切实际，而基于学习特征或 Hinge 统计特征的作家代码并未提高识别性能。

Jul, 2023

无真实材料的手写文本识别模型评估

这篇论文介绍了在应用阶段中评估手写文本识别 (HTR) 模型所面临的问题，以及介绍了使用不依赖于地面真实文本数据的指标来选择最佳模型的方法，其中包括使用标准语言模型和遮盖语言模型 (MLM) 的复杂度更高的方法，并表明 MLM 评估可以与基于词典的方法相竞争，其优点在于大型和多语言 Transformer 是随时可以使用的。

Jan, 2022

手写文本识别系统的最佳实践

手写文本识别已得到迅速发展，本论文通过实验证明了在预处理、CNN 架构和 CTC 损失三个方面的简单修改，可以提高手写文本识别系统的性能。

Apr, 2024

评估人工合成预训练在手写处理任务中的应用

本文探讨了在合成单词图像上进行大规模预训练，以提高四项基准笔迹分析任务的性能。作者利用全监督目标对简单的卷积神经网络进行训练，得到编码笔迹风格的图像向量表示，进而实现了笔迹风格的作者检索、鉴别、验证、分类任务，并展示了该预训练策略提取了作者风格的丰富表征，可以在这些任务中得到与任务特定的最先进方法相竞争的结果。

Apr, 2023

VATr++：为手写文本生成明智选择您的字词

研究了手写体文本生成的影响因素，提出了输入准备和训练规范化策略，以获得更好的性能和更好的泛化能力，并提出了手写体文本生成的评估协议的标准化和全面的对比分析，推动该领域的进展。

Feb, 2024

众包标注中的手写文本识别

本文研究了多种训练模型的方式来识别手写文本，特别是在存在多个不完整或有噪声的转录版本时，考虑了不同的训练配置和数据选择方法，并在法国贝尔福市的城市登记册上进行了实验，结果表明，计算共识转录或基于多个转录进行训练是有希望的替代方案，但基于注释者之间的一致程度选择训练样本会引入偏差并不能提高结果。

Jun, 2023

卷积识别模型特征与文本标签相结合的离线检测错误拼写的手写词

通过引入与文本进行比较的任务，我们提出了一个无限制的二元分类器，其中包括一个手写识别特征提取器和一个多模态分类头，该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明，与直接使用最先进的手写识别模型来解决任务相比，尽管保持高回收率，但分类器可以进行校准，使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。

Sep, 2023