实时也门货币识别
本文尝试使用人工智能 / 机器学习应用程序为视力受损人士在埃塞俄比亚的使用货币场景提供解决方案。该移动应用程序可以扫描货币并在 Amharic 语言中告知其类型,旨在减轻埃塞俄比亚视力障碍人士的负担。该模型在数据集上实现了 98.9%的分类准确率。
Aug, 2022
通过图像处理技术和机器学习算法,提出一种用于检测伪造的阿富汗纸币的方法,分析其安全特征并进行分类识别,其中随机森林算法检测假冒纸币的准确率达到了 99%。
May, 2023
该研究探讨了一种基于深度学习的移动应用的开发和实施,旨在通过移动设备上的实时图像处理准确识别和区分不同类型的药丸以协助盲人和视障人士,该应用利用文本转语音(TTS)提供即时的听觉反馈,提高了视障用户的可用性和独立性。研究评估了应用的检测准确性和用户体验,凸显其在改善视障人士社区的药物管理和安全方面的潜力。
May, 2024
本研究使用 YOLO 模型和 OpenCV 库,利用实时视频检测对象并将图像识别结果以可听形式提供给视觉障碍者,成功实现了优秀的平均准确率 (mAP)。
Dec, 2023
本文提出了一种新的概率图模型,用于对突尼斯城市名称的文字进行建模和识别。采用基于动态分层贝叶斯网络的方法,采用分割和特征提取技术来减少识别过程中的复杂性和误差,实验结果非常有前途。
May, 2014
该研究深入探讨了深度学习模型在阿拉伯手写文本的人物生物识别上的准确性,并比较了三种先进的架构 ——ResNet50、MobileNetV2 和 EfficientNetB7,使用了三个广泛认可的数据集:AHAWP,Khatt 和 LAMIS-MSHD。结果表明,EfficientNetB7 在 AHAWP,Khatt 和 LAMIS-MSHD 数据集上的测试准确率分别达到了 98.57%,99.15%和 99.79%。EfficientNetB7 的出色性能归功于其创新的技术,包括复合缩放、深度可分离卷积和挤压和激励块。研究结果对于增强身份验证和认证系统具有重要意义,突显了深度学习在阿拉伯手写文本识别中的潜力。
Jun, 2024
本文开发了一个带有乌尔都文本的情景图像数据集,并提出使用机器学习方法从这些图像中检测乌尔都文本的方法,包括通过 MSER 方法提取文本区域、利用 SVM 分类器筛选非文本区域、HoG 特征训练第二个 SVM 分类器来进一步提高文本区域检测的性能。最终目的是为乌尔都文本检测研究提供数据资源,并突出该领域的挑战和研究空白。
Sep, 2022
本研究使用卷积神经网络和迁移学习,开发了一个实时计算机视觉系统,用于自动手枪检测。通过对在线手枪检测方法的全面分析,强调降低误报率和学习时间。通过迁移学习,证明了其有效性。尽管存在技术挑战,所提出的系统实现了 84.74% 的准确率,展示了与相关作品相当的有希望的性能,从而实现了更快的学习和精确的自动手枪检测以增强安全性。本研究通过减少对人员监控的依赖,推动了安全措施的发展,展示了基于迁移学习的方法在高效可靠的手枪检测方面的潜力。
Nov, 2023
我们提出的智能检测网络在手写数学公式识别中利用物体检测技术,与传统编码器 - 解码器方法不同,能够精确检测符号和数字,优于其他网络在识别复杂手写数学表达式方面,对 HMER 领域具有潜在的宝贵贡献。
Nov, 2023