用于合成至真实手写单词识别的无监督适应
本文提出了一种新颖的元学习框架,该框架可以在推理过程中通过支持集合利用额外的新作者数据并通过单个梯度步更新输出作者自适应模型,这个模型可以在最先进的 HTR 模型之上轻松实现,并且可以在极少的新风格数据下实现平均 5-7% 的性能提升。
Apr, 2021
通过对大型基准数据集和通过手写文本生成模型产生的合成数据集的研究,本文提出在大数据集上预训练手写文本识别模型,并在少量带有个人特点手写的小规模数据集上进行微调,以有效转录手稿。
May, 2023
手写识别中,深度学习取得了显著成就。然而,神经网络在处理数据分布转变时存在问题。本文讨论如何使手写识别模型能够自适应不同风格的书写,通过使用少量新人笔迹的例子进行适应。通过两种基本模型以及模型无关元学习和作家代码两种方法,实验结果表明 MetaHTR 在适应性上优于基准模型,提高了 1.4 到 2.0 的词错误率,并且深层模型适应性好于浅层模型。然而,MetaHTR 在更大模型或句子级别的手写识别中的计算和内存需求可能变得不切实际,而基于学习特征或 Hinge 统计特征的作家代码并未提高识别性能。
Jul, 2023
本研究主要解决将手写文本识别能力添加到大规模多语言 OCR 系统中的难点,包括数据获取,效率和集成等三个方面,通过使用在线手写数据集和基于神经网络的线识别模型等方式解决了这些问题,实现了 HTR 能力在 OCR 系统中的集成。
Apr, 2019
介绍一种基于半监督学习的手写文本图像合成方法,该方法可生成任意长度的词汇风格多样的手写文本图像,并实现其风格的操纵,能够提高光学字符识别系统的性能。
Mar, 2020
手写文本识别 (HTR) 是计算机视觉中一个相关的问题,由于其固有的可变性和对其解释所需的丰富的环境依赖性,其面临独特的挑战。本文研究了一种名为空间上下文自我监督学习(Spatial Context-based SSL)的方法,并探索了该方法在 HTR 中的应用和优化。我们的实验表明,所考虑的方法在一些基准案例中推动了 HTR 领域自我监督学习的最新技术进展。
Apr, 2024
通过引入与文本进行比较的任务,我们提出了一个无限制的二元分类器,其中包括一个手写识别特征提取器和一个多模态分类头,该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明,与直接使用最先进的手写识别模型来解决任务相比,尽管保持高回收率,但分类器可以进行校准,使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。
Sep, 2023
研究了手写体文本生成的影响因素,提出了输入准备和训练规范化策略,以获得更好的性能和更好的泛化能力,并提出了手写体文本生成的评估协议的标准化和全面的对比分析,推动该领域的进展。
Feb, 2024
我们提出了一种新型的基于 Transformer 的手写文本样式图像生成方法,旨在学习样式 - 内容的缠结以及全局和局部写作风格模式。通过自注意机制,所提出的 HWT 捕捉了样式示例中的长距离和短距离关系,从而编码了全局和局部样式模式。此外,所提出的基于 Transformer 的 HWT 包括编码器 - 解码器注意力,通过聚集每个查询字符的样式表示来实现样式 - 内容缠结。
Apr, 2021