UIT-HWDB: 使用转移学习方法构建越南随笔手写图像识别的新基准
本文提出一种无监督的写手适应方法,使用合成字体完全训练出的识别器自动适应新的入职写手,从而提供了一种实用且通用的方法来处理新的文档收集,而不需要任何昂贵和繁琐的手动注释步骤。
Sep, 2019
本研究主要解决将手写文本识别能力添加到大规模多语言 OCR 系统中的难点,包括数据获取,效率和集成等三个方面,通过使用在线手写数据集和基于神经网络的线识别模型等方式解决了这些问题,实现了 HTR 能力在 OCR 系统中的集成。
Apr, 2019
手写识别是模式识别和机器学习领域中具有挑战性和关键问题,其应用领域广泛。本文专注于离线阿拉伯手写文本识别问题,并引入两种替代架构,即 Transformer Transducer 和标准序列到序列 Transformer,并比较它们在准确性和速度方面的性能表现,结果显示我们的方法在识别离线阿拉伯手写文本方面优于当前最先进的方法。
Jul, 2023
本文介绍了一种支持 102 种语言的在线手写系统,采用深度神经网络架构和贝塞尔曲线的新输入编码,与之前的系统相比降低了 20%-40% 的错误率,并在 IAM-OnDB 数据集上取得了新的最优结果。通过实验确定了模型的最优配置,并在多个公共数据集上进行了评估。
Feb, 2019
该文章介绍了一个新的离线手写文本识别数据集,集中在孟加拉文字的图像上,该数据集包括 788 张手写页面图像和一个用于无监督聚类线分割的方案。该数据集可以用于各种手写文档识别、词识别、词或行分割等任务。
May, 2022
司法笔迹鉴定是法医科学的一个分支,旨在通过全面比较内在的局部和全局特征,检验手写文件以准确定义或假设手稿的作者。该研究提出了一个新的数据集,包括传统手写文件和数字工具(如平板电脑)生成的文件之间的比较,并展示了数据的初步结果,显示第一子集可以达到 90%的分类准确率,第二子集可以达到 96%。
Jan, 2024
通过对大型基准数据集和通过手写文本生成模型产生的合成数据集的研究,本文提出在大数据集上预训练手写文本识别模型,并在少量带有个人特点手写的小规模数据集上进行微调,以有效转录手稿。
May, 2023
通过研究在线手写识别与 VLM(视觉 - 语言模型)的结合,该论文提出了一种新颖的数字墨迹令牌化表示方法,该方法在多个公共数据集上呈现与最先进的在线手写识别器可比拟甚至更好的结果,有着广泛的应用潜力。
Feb, 2024
本文介绍了一种技术,通过加入实际的随机噪声到参数实例化中,从现有样本生成新的训练样本数据,以实现针对缺少大量标记数据的本地语言的字符识别,同时可用于物体识别等相关上下文。
Apr, 2019
通过引入与文本进行比较的任务,我们提出了一个无限制的二元分类器,其中包括一个手写识别特征提取器和一个多模态分类头,该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明,与直接使用最先进的手写识别模型来解决任务相比,尽管保持高回收率,但分类器可以进行校准,使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。
Sep, 2023