基于单个手写单词图像的深度自适应写手识别学习
本文提出了一种基于注意力驱动的卷积神经网络的作者识别系统,该系统利用从词图像中提取的图像片段进行训练,采用金字塔策略。该系统能够全面捕捉数据的细节和粗糙特征,以及不同抽象层次上的信息。此外,文中探讨了使用注意力机制来增强学习特征的表征能力。该算法在三个基准数据库上进行了评估,证明了其在作者识别任务中的有效性,尤其是在有限手写数据的情景中。
Apr, 2024
通过使用卷积神经网络的激活特征作为本地描述符,结合高斯混合模型超向量编码和 KL-Kernel 归一化,我们提出了一种用于笔迹识别的全局描述符方法,在 ICDAR 2013 基准数据库和 CVL 数据集上进行了评估,在挑战性的双语 ICDAR 数据集上改进了 0.21 个 mAP 的绝对值。
Feb, 2024
该研究引入了一个名为 DeepWriterID 的系统,该系统利用深度卷积神经网络进行笔迹、手写体识别,并引入了一种名为 DropSegment 的新方法来实现数据增强和改善 CNN 的泛化适用性。通过在笔放置状态下只使用笔位信息,该系统在 NLPR 手写数据库中实现了 95.72%的中文文本识别率和 98.51%的英文文本识别率,创造了新的最高记录。
Aug, 2015
通过引入与文本进行比较的任务,我们提出了一个无限制的二元分类器,其中包括一个手写识别特征提取器和一个多模态分类头,该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明,与直接使用最先进的手写识别模型来解决任务相比,尽管保持高回收率,但分类器可以进行校准,使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。
Sep, 2023
本文提出了一个基于单词或文本块图像的笔迹识别的新基准研究,旨在提取有效特征。通过使用 FragNet 这个深层神经网络来解决这个问题,得到了准确的结果。实验表明,该方法可以基于单词和页面图像进行高效和稳健的笔迹识别。
Mar, 2020
手写识别中,深度学习取得了显著成就。然而,神经网络在处理数据分布转变时存在问题。本文讨论如何使手写识别模型能够自适应不同风格的书写,通过使用少量新人笔迹的例子进行适应。通过两种基本模型以及模型无关元学习和作家代码两种方法,实验结果表明 MetaHTR 在适应性上优于基准模型,提高了 1.4 到 2.0 的词错误率,并且深层模型适应性好于浅层模型。然而,MetaHTR 在更大模型或句子级别的手写识别中的计算和内存需求可能变得不切实际,而基于学习特征或 Hinge 统计特征的作家代码并未提高识别性能。
Jul, 2023
本文探讨了在合成单词图像上进行大规模预训练,以提高四项基准笔迹分析任务的性能。作者利用全监督目标对简单的卷积神经网络进行训练,得到编码笔迹风格的图像向量表示,进而实现了笔迹风格的作者检索、鉴别、验证、分类任务,并展示了该预训练策略提取了作者风格的丰富表征,可以在这些任务中得到与任务特定的最先进方法相竞争的结果。
Apr, 2023
本研究通过半监督特征学习管道建立起加权标签平滑正则化(WLSR)方法,将额外的无标签数据分配给加权一致的标签分布,用以解决线下手写体识别中监督学习方法所需的训练数据和潜在的过度拟合误差问题。在 ICDAR2013 和 CVL 等知名基准数据集上,实验结果表明,该方法显著提高了基线度量,并具有现有线下写字的识别方法相竞争的表现。这些发现为离线写字体识别提供了新的视角。
Jul, 2018