使用卷积神经网络激活特征的离线作者识别
该研究引入了一个名为DeepWriterID的系统,该系统利用深度卷积神经网络进行笔迹、手写体识别,并引入了一种名为DropSegment的新方法来实现数据增强和改善CNN的泛化适用性。通过在笔放置状态下只使用笔位信息,该系统在NLPR手写数据库中实现了95.72%的中文文本识别率和98.51%的英文文本识别率,创造了新的最高记录。
Aug, 2015
本研究通过半监督特征学习管道建立起加权标签平滑正则化(WLSR)方法,将额外的无标签数据分配给加权一致的标签分布,用以解决线下手写体识别中监督学习方法所需的训练数据和潜在的过度拟合误差问题。在ICDAR2013和CVL等知名基准数据集上,实验结果表明,该方法显著提高了基线度量,并具有现有线下写字的识别方法相竞争的表现。这些发现为离线写字体识别提供了新的视角。
Jul, 2018
该论文提出了一种基于多任务深度自适应学习的方法,利用深度卷积神经网络从显式内容识别的辅助任务中学习通用的特征,从而提高单词图像的写作者识别性能。
Sep, 2018
本文提出了一个基于单词或文本块图像的笔迹识别的新基准研究,旨在提取有效特征。通过使用 FragNet 这个深层神经网络来解决这个问题,得到了准确的结果。实验表明,该方法可以基于单词和页面图像进行高效和稳健的笔迹识别。
Mar, 2020
提出了一种全局正则网络(GRN),其由一个带有全局特征提取器的分支和一个带有局部特征提取器的分支组成,两者以一种全局残差方式融合,可以有效地识别手写字的写作人,实验表明该模型在CVL数据集上取得了卓越的99.98%-1准确率和100% top-5准确率,具有更短的训练时间和更少的网络参数。
Jan, 2022
本文探讨了在合成单词图像上进行大规模预训练,以提高四项基准笔迹分析任务的性能。作者利用全监督目标对简单的卷积神经网络进行训练,得到编码笔迹风格的图像向量表示,进而实现了笔迹风格的作者检索、鉴别、验证、分类任务,并展示了该预训练策略提取了作者风格的丰富表征,可以在这些任务中得到与任务特定的最先进方法相竞争的结果。
Apr, 2023
手写识别中,深度学习取得了显著成就。然而,神经网络在处理数据分布转变时存在问题。本文讨论如何使手写识别模型能够自适应不同风格的书写,通过使用少量新人笔迹的例子进行适应。通过两种基本模型以及模型无关元学习和作家代码两种方法,实验结果表明MetaHTR在适应性上优于基准模型,提高了1.4到2.0的词错误率,并且深层模型适应性好于浅层模型。然而,MetaHTR在更大模型或句子级别的手写识别中的计算和内存需求可能变得不切实际,而基于学习特征或Hinge统计特征的作家代码并未提高识别性能。
Jul, 2023
本文提出了一种基于注意力驱动的卷积神经网络的作者识别系统,该系统利用从词图像中提取的图像片段进行训练,采用金字塔策略。该系统能够全面捕捉数据的细节和粗糙特征,以及不同抽象层次上的信息。此外,文中探讨了使用注意力机制来增强学习特征的表征能力。该算法在三个基准数据库上进行了评估,证明了其在作者识别任务中的有效性,尤其是在有限手写数据的情景中。
Apr, 2024
利用卷积神经网络(CNNs)对非母语使用者书写的英文字母进行分类识别,借助HIEC数据集训练了一个定制的CNN模型,并通过调整超参数进行了消融研究,结果显示该模型在字符识别准确性方面优于其他模型,达到了97.04%的准确度,相对于次优模型提升了4.38%。
Jun, 2024
本研究解决了传统作家检索中手工特征和卷积神经网络特征应用不足的问题。我们提出了一种新方法,利用自监督学习从视觉 Transformer 提取特征,并通过 VLAD 编码进行聚合。结果显示,该方法在历史文件集上达到了新的最佳性能,展示了其在现代数据集上的广泛适用性。
Sep, 2024