基于 HMM 的印地语手写词识别技术:分区分割
提出了一种新的跨语言平台,用于手写单词识别和标记低资源脚本,其中使用可用脚本(考虑为源脚本)的充分大的数据集进行训练,并在其他脚本(考虑为目标脚本)上进行测试,该跨语言框架通过使用浅显易懂的分区内字符映射进行有效的学习,成功实现了在少量训练数据的情况下识别和标记三种印度脚本中的文本。
Dec, 2017
本文介绍了一个新的深度学习方法 (BN-DRISHTI),它结合了基于 YOLO 的物体检测框架、Hough 变换和仿射变换来解决孟加拉语手写体识别的线条和单词分割问题,同时还提供了一个包含 786 张手写孟加拉语文档图像的扩展数据集 (BN-HTRd) 以及相应的线条和单词级别注释,用于单词识别的地面实况。该方法的在测试部分上得到了非常高的线条 (99.97%) 和单词 (98%) 分割 F 分数,表现优于外部三个孟加拉手写数据集。
May, 2023
通过增强谐波搜索方法,提出了一种基于区域选择的技术,应用于手写字符的识别中,测试结果表明,可以在不影响识别精度的前提下,大幅减少描述性区域的数量,提高识别准确性。
May, 2016
本文提出了一种新的概率图模型,用于对突尼斯城市名称的文字进行建模和识别。采用基于动态分层贝叶斯网络的方法,采用分割和特征提取技术来减少识别过程中的复杂性和误差,实验结果非常有前途。
May, 2014
该文章介绍了一个新的离线手写文本识别数据集,集中在孟加拉文字的图像上,该数据集包括 788 张手写页面图像和一个用于无监督聚类线分割的方案。该数据集可以用于各种手写文档识别、词识别、词或行分割等任务。
May, 2022
本文提出了一种新颖的方法,通过逐步学习出现频率从高到低的复合字符类以及基本字符,设计合适的特征集以识别手写孟加拉字符,实现了 79.25% 的平均字符识别率。
Feb, 2010
在线手写字符分割与手写识别紧密关联,但仅通过识别模型定位相关位置通常无法产生精确的分割。我们将分割与识别解耦,使得分割结果能进一步被利用。我们专注于已知转录的情况,此时字符分割变成了笔迹轨迹的采样点与文本中字符的匹配问题。受 $k$-means 聚类算法启发,我们从簇分配的角度看待它,并提出了一种基于 Transformer 的架构,在 Transformer 解码器块中使用学得的字符查询形成每个簇。为了评估我们方法的质量,我们为两个流行的在线手写数据集 IAM-OnDB 和 HANDS-VNOnDB 创建了字符分割的真值,并对它们进行了多种方法的评估,证明我们的方法达到了最佳的整体效果。
Sep, 2023
提出了一种从头开始训练的、端到端的、无分割的深度学习模型,利用 DCNN 进行特征提取,同时利用双向 LSTM 进行序列识别和 CTC 损失函数在 KHATT 数据库上进行训练,使得字符级别上测试数据集的识别率达到 84%,单词级别上达到 71%,建立了一种仅在行级别上操作而无需分割的基于图像的序列识别框架。同时介绍了 KFUPM Handwritten Arabic TexT (KHATT) 数据库的分析和预处理。最后,实现了包括滤波、变换和行分割等高级图像处理技术。该工作的重要性在于其广泛的应用,包括银行业的数字化、文档化、存档和文本翻译。此外,AHR 作为一种关键工具,可以使图像可搜索,增强信息检索能力,并实现轻松编辑。这一功能显著减少了阿拉伯语数据组织和处理等任务所需的时间和努力。
Jun, 2024
本文研究提出了一种基于条件随机场序列建模器的乌尔都语词分割系统,使用正字法、语言学和形态学特征,该模型能够自动学习预测单词边界和子单词边界,在手动注释的语料库上实现了 0.97 的单词边界识别 F1 分数和 0.85 的子单词边界识别 F1 分数。
Jun, 2018
本文利用 Maxout 网络和混合 HMM 模型提出新的解决方案,将字符和单词识别问题相结合并构建成可调节和高精度的识别系统,取得了在 ICDAR 2003 和 SVT 基准数据集上超越现有方法的最佳结果。
Oct, 2013