基于 HMM 的印地语手写词识别技术：分区分割

Aug, 2017

基于 HMM 的印地语手写词识别技术：分区分割

HMM-based Indic Handwritten Word Recognition using Zone Segmentation

Partha Pratim Roy, Ayan Kumar Bhunia, Ayan Das, Prasenjit Dey, Umapada Pal

TL;DR采用区域分割和 PHOG 特征的 HMM 方法，实现印度文字的手写单词识别，相较传统方式，该方法被证明提高了精度。

Abstract

This paper presents a novel approach towards Indic handwritten word recognition using zone-wise information. Because of complex nature due to compound characters, modifiers, overlapping and touching, etc., character segmentation and recognition is a tedious job in indic scripts (e.g. D

indic scripts handwritten word recognition zone segmentation phog hmm

发现论文，激发创造

用于印地语书写的跨语言词汇识别和定位框架

提出了一种新的跨语言平台，用于手写单词识别和标记低资源脚本，其中使用可用脚本（考虑为源脚本）的充分大的数据集进行训练，并在其他脚本（考虑为目标脚本）上进行测试，该跨语言框架通过使用浅显易懂的分区内字符映射进行有效的学习，成功实现了在少量训练数据的情况下识别和标记三种印度脚本中的文本。

Dec, 2017

BN-DRISHTI：通过手写文本实例级分割实现孟加拉文档识别

本文介绍了一个新的深度学习方法 (BN-DRISHTI)，它结合了基于 YOLO 的物体检测框架、Hough 变换和仿射变换来解决孟加拉语手写体识别的线条和单词分割问题，同时还提供了一个包含 786 张手写孟加拉语文档图像的扩展数据集 (BN-HTRd) 以及相应的线条和单词级别注释，用于单词识别的地面实况。该方法的在测试部分上得到了非常高的线条 (99.97%) 和单词 (98%) 分割 F 分数，表现优于外部三个孟加拉手写数据集。

May, 2023

基于区域采样的增强版和声搜索方法用于孟加拉手写字符识别

通过增强谐波搜索方法，提出了一种基于区域选择的技术，应用于手写字符的识别中，测试结果表明，可以在不影响识别精度的前提下，大幅减少描述性区域的数量，提高识别准确性。

May, 2016

用于阿拉伯手写字识别的动态分层贝叶斯网络

本文提出了一种新的概率图模型，用于对突尼斯城市名称的文字进行建模和识别。采用基于动态分层贝叶斯网络的方法，采用分割和特征提取技术来减少识别过程中的复杂性和误差，实验结果非常有前途。

May, 2014

BN-HTRd: 一份用于离线孟加拉文手写文本识别（HTR）和行分割的基准数据集

该文章介绍了一个新的离线手写文本识别数据集，集中在孟加拉文字的图像上，该数据集包括 788 张手写页面图像和一个用于无监督聚类线分割的方案。该数据集可以用于各种手写文档识别、词识别、词或行分割等任务。

May, 2022

使用 MLP 和 SVM 分类器进行孟加拉基本字符和复合字符的手写识别

本文提出了一种新颖的方法，通过逐步学习出现频率从高到低的复合字符类以及基本字符，设计合适的特征集以识别手写孟加拉字符，实现了 79.25% 的平均字符识别率。

Feb, 2010

字符查询：基于 Transformer 的在线手写字符分割方法

在线手写字符分割与手写识别紧密关联，但仅通过识别模型定位相关位置通常无法产生精确的分割。我们将分割与识别解耦，使得分割结果能进一步被利用。我们专注于已知转录的情况，此时字符分割变成了笔迹轨迹的采样点与文本中字符的匹配问题。受 $k$-means 聚类算法启发，我们从簇分配的角度看待它，并提出了一种基于 Transformer 的架构，在 Transformer 解码器块中使用学得的字符查询形成每个簇。为了评估我们方法的质量，我们为两个流行的在线手写数据集 IAM-OnDB 和 HANDS-VNOnDB 创建了字符分割的真值，并对它们进行了多种方法的评估，证明我们的方法达到了最佳的整体效果。

Sep, 2023

一种无分割的端到端阿拉伯手写识别模型在 KHATT 上的应用

提出了一种从头开始训练的、端到端的、无分割的深度学习模型，利用 DCNN 进行特征提取，同时利用双向 LSTM 进行序列识别和 CTC 损失函数在 KHATT 数据库上进行训练，使得字符级别上测试数据集的识别率达到 84%，单词级别上达到 71%，建立了一种仅在行级别上操作而无需分割的基于图像的序列识别框架。同时介绍了 KFUPM Handwritten Arabic TexT (KHATT) 数据库的分析和预处理。最后，实现了包括滤波、变换和行分割等高级图像处理技术。该工作的重要性在于其广泛的应用，包括银行业的数字化、文档化、存档和文本翻译。此外，AHR 作为一种关键工具，可以使图像可搜索，增强信息检索能力，并实现轻松编辑。这一功能显著减少了阿拉伯语数据组织和处理等任务所需的时间和努力。

Jun, 2024

使用条件随机场（CRFs）进行乌尔都语词语分割

本文研究提出了一种基于条件随机场序列建模器的乌尔都语词分割系统，使用正字法、语言学和形态学特征，该模型能够自动学习预测单词边界和子单词边界，在手动注释的语料库上实现了 0.97 的单词边界识别 F1 分数和 0.85 的子单词边界识别 F1 分数。

Jun, 2018

使用混合 HMM Maxout 模型的端到端文本识别

本文利用 Maxout 网络和混合 HMM 模型提出新的解决方案，将字符和单词识别问题相结合并构建成可调节和高精度的识别系统，取得了在 ICDAR 2003 和 SVT 基准数据集上超越现有方法的最佳结果。

Oct, 2013