利用机器学习技术促进不发达语言的发展：乌尔都语文本检测进展

Sep, 2022

利用机器学习技术促进不发达语言的发展：乌尔都语文本检测进展

Leveraging machine learning for less developed languages: Progress on Urdu text detection

Hazrat Ali

TL;DR本文开发了一个带有乌尔都文本的情景图像数据集，并提出使用机器学习方法从这些图像中检测乌尔都文本的方法，包括通过 MSER 方法提取文本区域、利用 SVM 分类器筛选非文本区域、HoG 特征训练第二个 SVM 分类器来进一步提高文本区域检测的性能。最终目的是为乌尔都文本检测研究提供数据资源，并突出该领域的挑战和研究空白。

Abstract

Text detection in natural scene images has applications for autonomous driving, navigation help for elderly and blind people. However, the research on urdu text detection is usually hindered by lack of data resources. We have developed a dataset of scene images with Urdu text. We prese

urdu text detection machine learning methods mser method support vector machine histogram of oriented gradients

发现论文，激发创造

乌尔都语自然场景文本检测、识别和视觉问答的数据集和基准

通过提供 1000 多幅自然场景图像，该研究提出了一个新的多任务乌尔都语场景文本数据集，用于文本检测、识别和视觉问答任务，并解决了之前数据集在面对任意形状文本时的限制。该数据集通过引入额外的标注点，方便了对能够处理多样文本布局、复杂形状和非标准方向的方法进行开发和评估，帮助进一步推动乌尔都语场景文本理解方法的发展。

May, 2024

MENTOR：面向类推学习的多语言文本检测

我们提出了一种通用的多语言文本检测框架，可以在场景图像中检测和识别已知和未知语言区域，不需要为未知语言收集有监督的训练数据或进行模型重新训练。

Mar, 2024

自然场景图像中的鲁棒文字检测

本文提出了一种准确和鲁棒性较高的文本检测方法，通过设计快速有效的剪枝算法，使用最小化正则化变化策略来提取极值区域，然后通过单链接聚类算法将字符候选分组为文本候选，在使用一种自学习距离度量算法自动学习距离权重和聚类算法的阈值来识别文本候选，并使用字符分类器估计相应的文本候选的后验概率来消除具有高概率的非文本文本候选，并最终识别出文本。通过实验结果证明，该方法的检测效果优于其他竞争方法。

Jan, 2013

UTRNet: 印刷文件中的高分辨率乌尔都文本识别

本文提出了一种新方法来解决印地语文本识别的挑战，提出了 UTRNet 结构，并介绍了两个大规模数据集 UTRSet-Real 和 UTRSet-Synth 以及 UrduDoc 数据集，最终实现了与其他 OCR 技术相比较优异的效果。

Jun, 2023

利用文本分割和深度卷积序列从自然场景图像中离线提取印度区域语言

本文提出了一种通过图像纠正和分割以及使用深度学习技术进行文本识别和自然语言处理的方法，以从自然现场图像中提取区域语言信息，相比现有方法具有更好的性能。

Jun, 2018

使用监督式机器学习和特征组合检测乌尔都语中的滥用和威胁性语言

本文介绍了参加 FIRE Shared Task 2021 的系统描述，该任务旨在自动识别乌尔都语中的滥用和威胁推文，结果显示支持向量机在去除停用词、应用词形还原、使用单词 n-grams (n = 1,2,3) 组合创建的特征矢量的条件下在滥用语言检测的任务上表现最佳，而在威胁语言检测的任务上，使用去除停用词、不应用词形还原、使用预训练的乌尔都语 Word2Vec 创建的特征向量，并使用过 - 采样技术使数据集平衡的支持向量机获得了最佳表现，本文的代码也可用于再现。

Apr, 2022

使用深度学习技术生成的乌尔都诗歌

使用不同的深度学习技术和算法生成乌尔都诗歌，通过 Rekhta 网站收集了 1341 个文本文件，采用 LSTM 和 GRU 等深度学习技术，并运用自然语言处理和机器学习分析和生成人们能够理解和使用的乌尔都语诗歌。

Sep, 2023

多语言自然场景文本检测算法研究

我们提出了一种多语言文本检测模型，通过引入 SFM Swin Transformer 特征提取网络、AS-HRFPN 特征融合网络和全局语义分割分支，改进了对自然场景中多语言文本的检测准确性和难度，实验结果表明该算法 F-measure 值为 85.02%，比基准模型高出 4.71%。

Dec, 2023

使用监督式机器学习与特征组合的 2021 年乌尔都语假新闻检测任务

本文介绍了参加 FIRE 2021 共享任务的系统描述：“乌尔都语中的虚假新闻检测”。研究目的在于自动识别乌尔都语中写的虚假新闻。我们的结果在比赛中排名第五，但是在比赛结果公布后，我们的结果得到了进一步改善。我们的其中一个模型在支持向量机（使用多项式核函数，数字为 1）上的最佳 F1 宏平均分数为 0.6674，比比赛中排名第二的分数更高。结果是通过去除停用词、应用词形还原并从总共 1,557,000 个生成的单词 n-gram n=1,2,3,4 和字符 n-gram n=2,3,4,5,6 中选择 20k 个最佳特征而实现的。代码已提供用于再现。

Apr, 2022

基于深度学习的孟加拉标牌地址信息的检测、识别和解析

通过深度学习模型，我们提出了一个端到端系统来高效地检测、识别、校正和解析孟加拉语标牌上的地址信息，并设计了一种新颖的地址文本校正模型和孟加拉语地址文本解析器。

Nov, 2023