基于改进 U-net 架构的矩阵模板中学生编号的识别
我们提出的智能检测网络在手写数学公式识别中利用物体检测技术,与传统编码器 - 解码器方法不同,能够精确检测符号和数字,优于其他网络在识别复杂手写数学表达式方面,对 HMER 领域具有潜在的宝贵贡献。
Nov, 2023
本文提出了一种集成了多个步骤的深度卷积神经网络,直接在图像像素上解决了识别街景图像中任意多位数字的难题,并在公开数据集 SVHN 上达到超过 96% 的识别率,在识别每个数字的任务上超过了当前最先进的技术,在 reCAPTCHA 上的识别准确率为 99.8%,表明该系统在特定操作阈值下可以与甚至超过人类操作员的性能。
Dec, 2013
纠正学生们的多项选择答案是一个重复和机械的任务,可以被视为一项图像多分类任务,我们设置了五个分类,其中四个是可能的正确选项,一个是其他不正确的写法,考虑到非标准写法选项的可能性。
Sep, 2023
本文提出一种结合深度哈希框架和神经网络解码器(NND)的新型体系结构,用于人脸模板保护,可以在零 - 拍摄、一次拍摄和多次拍摄注册的情况下提供更好的匹配性能,并且由于不需要重新训练,可以避免添加新主体时需要重新训练的问题.
Aug, 2019
该研究深入探讨了深度学习模型在阿拉伯手写文本的人物生物识别上的准确性,并比较了三种先进的架构 ——ResNet50、MobileNetV2 和 EfficientNetB7,使用了三个广泛认可的数据集:AHAWP,Khatt 和 LAMIS-MSHD。结果表明,EfficientNetB7 在 AHAWP,Khatt 和 LAMIS-MSHD 数据集上的测试准确率分别达到了 98.57%,99.15%和 99.79%。EfficientNetB7 的出色性能归功于其创新的技术,包括复合缩放、深度可分离卷积和挤压和激励块。研究结果对于增强身份验证和认证系统具有重要意义,突显了深度学习在阿拉伯手写文本识别中的潜力。
Jun, 2024
本文介绍了 TableNet—— 一种新颖的端到端深度学习模型,用于识别文档图像中的表格,并提出了一种语义规则的行提取方法,结果表明该模型在两个公开数据集(ICDAR 2013 和 Marmot Table)上都达到了最佳性能,并能通过给模型添加额外的语义特征进行性能提升,同时表明该模型对数据集的迁移学习效果良好。
Jan, 2020
通过使用深度学习卷积神经网络架构(如可调整的 U-Net),我们提出了一种在实验 XRD 图像中识别伪迹的方法,结果表明 U-Net 在测试数据集上能够一致地产生 92.4% 的召回率,与传统方法相比平均错误率降低了 34%,同时减少了 50% 以上的识别和排除伪迹的时间,进一步分析了后处理 XRD 数据的集成 1D XRD 图案。
Oct, 2023
提出了一种矩阵神经网络(MatNet),通过双线性映射从上一层单元中感知总结信息,并方便地扩展到多模输入,应用于 MNIST 手写数字分类和图像超分辨率任务中,具有与最先进方法可比较的性能和大大降低的复杂性。
Jan, 2016