基于区域采样的增强版和声搜索方法用于孟加拉手写字符识别
本文提出了一种新颖的方法,通过逐步学习出现频率从高到低的复合字符类以及基本字符,设计合适的特征集以识别手写孟加拉字符,实现了 79.25% 的平均字符识别率。
Feb, 2010
提出了一种无限制端到端的文本定位和识别方法,采用基于区域的方法在单次检测中检测初始文本假设,并通过更强大的局部文本模型对文本假设进行优化。此外,引入了一种基于字符笔画面积估计的新特征,并使用区域距离图有效计算该特征,该特征不受缩放和旋转的影响,并允许有效地检测任何文本区域。该方法能实时运行并在 ICDAR 2013 Robust Reading 数据集上实现了最先进的文本定位和识别结果。
Apr, 2015
提出了一种与字符笔画方向和顺序变化无关的一组特征,用于在线手写字符识别。通过一种方法,将特征如点的坐标、点处笔画的方向以及点处笔画方向的动态在坐标值方面进行空间映射,并在空间图中的不同区域计算这些特征的直方图。通过训练分类器进行字符识别的其他研究中使用的各种特征,如时空特征、离散傅里叶变换、离散余弦变换、离散小波变换、空间特征和梯度方向直方图都被考虑。选择支持向量机(SVM)作为分类性能比较时的分类器。用于训练和测试分类器的字符数据集由 96 种不同的印地文字符的在线手写样本组成,训练数据集和测试数据集分别包含 12832 和 2821 个样本。与其他特征进行训练后,在相同测试数据集上测试的 SVM 分类器以提出的特征的 92.9% 最高分类准确率最高。因此,相比较而言,提出的特征具有更好的字符辨别能力。
Sep, 2023
基于多个卷积神经网络的集成模型 BanglaNet 被提出用于分类孟加拉基本字符、复合字符、数字和修饰符。在多个数据集上进行的严格实验表明,相比于最近的基于卷积神经网络的研究,该模型获得了显著的识别准确率。
Jan, 2024
开发了一个分类器,用于模拟印地语在线手写字符的全局字符特征、子单位数量和本地子单位特征的联合分布。该分类器使用潜变量来模拟子单位的结构,使用点、方向和方向动态的直方图(HPOD)特征表示字符的全局字符级和本地子单位级,并且不依赖于字符的笔画顺序和方向变化。通过最大似然估计方法来估计分类器的参数。本研究考虑了其他研究中使用的不同分类器和特征,对开发的分类器进行了分类性能比较。考虑的分类器包括二阶统计(SOS)、子空间(SS)、费舍尔判别(FD)、前馈神经网络(FFN)和支持向量机(SVM),考虑的特征包括时空(ST)、离散傅立叶变换(DFT)、离散余弦变换(SCT)、离散小波变换(DWT)、空间(SP)和梯度方向直方图(HOG)。用于训练和测试开发的分类器的印地语字符数据集由 96 个不同字符类别的手写字符样本组成。训练集中有 12832 个样本,每个字符类别平均 133 个样本;测试集中有 2821 个样本,每个字符类别平均 29 个样本。与在本研究中考虑的相同训练集和测试集上从同一训练集中提取的不同特征训练并在相同测试集上评估的分类器相比,开发的分类器在测试集上具有最高的准确性,为 93.5%。
Oct, 2023
该文章介绍了一个新的离线手写文本识别数据集,集中在孟加拉文字的图像上,该数据集包括 788 张手写页面图像和一个用于无监督聚类线分割的方案。该数据集可以用于各种手写文档识别、词识别、词或行分割等任务。
May, 2022
本文介绍了一个新的深度学习方法 (BN-DRISHTI),它结合了基于 YOLO 的物体检测框架、Hough 变换和仿射变换来解决孟加拉语手写体识别的线条和单词分割问题,同时还提供了一个包含 786 张手写孟加拉语文档图像的扩展数据集 (BN-HTRd) 以及相应的线条和单词级别注释,用于单词识别的地面实况。该方法的在测试部分上得到了非常高的线条 (99.97%) 和单词 (98%) 分割 F 分数,表现优于外部三个孟加拉手写数据集。
May, 2023
本研究提出了一种新的深度学习技术,用于识别手写孟加拉语复合字符,并报道了在 CMATERdb 3.1.3.3 数据集上的新的识别准确率基准。通过层级训练深度卷积神经网络,结合 RMSProp 算法,相较于标准的浅层学习和常规的 DCNN,实现了快速收敛和更高的识别率,创造了错误率为 9.67%、识别准确度为 90.33% 的新纪录。
Feb, 2018