UIT-HWDB: 使用转移学习方法构建越南随笔手写图像识别的新基准

MMNov, 2022

UIT-HWDB: 使用转移学习方法构建越南随笔手写图像识别的新基准

UIT-HWDB: Using Transferring Method to Construct A Novel Benchmark for Evaluating Unconstrained Handwriting Image Recognition in Vietnamese

PDF

Nghia Hieu Nguyen, Duong T.D. Vo, Kiet Van Nguyen

TL;DR本文提出了转移方法来构建手写图像数据集，以有效评估离线手写识别方法。我们提供了一个高质量的合成数据集，并使用各种现有方法进行了实验，以找出解决越南语手写识别问题的挑战。

Abstract

Recognizing handwriting images is challenging due to the vast variation in writing style across many people and distinct linguistic aspects of writing languages. In Vietnamese, besides the modern Latin characters, there are accent and letter marks together with characters that draw confusion to state-of-the-art →

handwriting recognition vietnamese language low-resource language dataset construction transferring method

发现论文，激发创造

用于合成至真实手写单词识别的无监督适应

本文提出一种无监督的写手适应方法，使用合成字体完全训练出的识别器自动适应新的入职写手，从而提供了一种实用且通用的方法来处理新的文档收集，而不需要任何昂贵和繁琐的手动注释步骤。

Sep, 2019

一个可扩展的手写文本识别系统

本研究主要解决将手写文本识别能力添加到大规模多语言 OCR 系统中的难点，包括数据获取，效率和集成等三个方面，通过使用在线手写数据集和基于神经网络的线识别模型等方式解决了这些问题，实现了 HTR 能力在 OCR 系统中的集成。

Apr, 2019

基于 Transformer 的阿拉伯离线手写文本识别方法

手写识别是模式识别和机器学习领域中具有挑战性和关键问题，其应用领域广泛。本文专注于离线阿拉伯手写文本识别问题，并引入两种替代架构，即 Transformer Transducer 和标准序列到序列 Transformer，并比较它们在准确性和速度方面的性能表现，结果显示我们的方法在识别离线阿拉伯手写文本方面优于当前最先进的方法。

Jul, 2023

基于 LSTM 的快速多语言在线手写识别

本文介绍了一种支持 102 种语言的在线手写系统，采用深度神经网络架构和贝塞尔曲线的新输入编码，与之前的系统相比降低了 20%-40% 的错误率，并在 IAM-OnDB 数据集上取得了新的最优结果。通过实验确定了模型的最优配置，并在多个公共数据集上进行了评估。

Feb, 2019

BN-HTRd: 一份用于离线孟加拉文手写文本识别（HTR）和行分割的基准数据集

该文章介绍了一个新的离线手写文本识别数据集，集中在孟加拉文字的图像上，该数据集包括 788 张手写页面图像和一个用于无监督聚类线分割的方案。该数据集可以用于各种手写文档识别、词识别、词或行分割等任务。

May, 2022

手写文件的非破坏性检验的新数据集

司法笔迹鉴定是法医科学的一个分支，旨在通过全面比较内在的局部和全局特征，检验手写文件以准确定义或假设手稿的作者。该研究提出了一个新的数据集，包括传统手写文件和数字工具（如平板电脑）生成的文件之间的比较，并展示了数据的初步结果，显示第一子集可以达到 90％的分类准确率，第二子集可以达到 96％。

Jan, 2024

如何选择预训练的手写识别模型用于单作者微调

通过对大型基准数据集和通过手写文本生成模型产生的合成数据集的研究，本文提出在大数据集上预训练手写文本识别模型，并在少量带有个人特点手写的小规模数据集上进行微调，以有效转录手稿。

May, 2023

在大型视觉语言模型中表示在线手写体以进行识别

通过研究在线手写识别与 VLM（视觉 - 语言模型）的结合，该论文提出了一种新颖的数字墨迹令牌化表示方法，该方法在多个公共数据集上呈现与最先进的在线手写识别器可比拟甚至更好的结果，有着广泛的应用潜力。

Feb, 2024

TextCaps: 使用非常小的数据集进行手写字符识别

本文介绍了一种技术，通过加入实际的随机噪声到参数实例化中，从现有样本生成新的训练样本数据，以实现针对缺少大量标记数据的本地语言的字符识别，同时可用于物体识别等相关上下文。

Apr, 2019

卷积识别模型特征与文本标签相结合的离线检测错误拼写的手写词

通过引入与文本进行比较的任务，我们提出了一个无限制的二元分类器，其中包括一个手写识别特征提取器和一个多模态分类头，该分类头将特征提取器的输出与输入文本的向量表示进行卷积。我们的模型的分类头完全基于使用最先进的生成对抗网络创建的合成数据进行训练。我们证明，与直接使用最先进的手写识别模型来解决任务相比，尽管保持高回收率，但分类器可以进行校准，使平均精确度提高了 19.5%。这种巨大的性能提升可以在利用人 - 环自动化的应用中带来显著的生产力增长。

Sep, 2023