本文介绍了一个 less computationally expensive 的全页手写文本识别框架,其中包括使用对象检测神经网络定位手写文本并使用多尺度 CNN 提取特征,然后将其输入到双向长短期记忆网络进行文本识别。该框架使用更少的内存和时间达到与现有框架相当的错误率,展示了该框架的潜力。
Oct, 2019
本文研究了图神经网络在时间序列分析中的应用,将时间序列视为有向图,利用图神经网络的结构探索时间依赖性,并开发了两个几何深度学习模型,一个用于有监督分类,另一个用于信号重构。将这些模型应用于质量识别问题。
Oct, 2023
本研究提出了一种基于递归神经网络的手绘图形识别架构,通过利用深度草图特征和加权每个时步损失来实现在大量对象类别上的最新结果,尤其适用于在线识别对象。
Aug, 2016
本文提出了一种名为全卷积循环网络 (FCRN) 的端到端框架用于手写汉字文本识别。FCRN 基于在线文本数据进行训练,不像传统方法依赖于分割,它学习将笔尖轨迹与字符序列关联起来。本文还提出了一种优化的波束搜索方法,有效地集成语言模型来解码 FCRN 并显著提高识别结果。在 CASIA-OLHWDB 和 ICDAR 2013 数据集上进行测试,分别获得 96.40% 和 95.00% 的正确率。
Apr, 2016
使用变形金刚模型的多头自我注意力层,无需回归方法且具有超出预定义词汇表的单词识别能力,能实现很高的手写识别精度,即使在少量样本学习情况下也可取得满意的结果。
May, 2020
本文提出了一种基于循环神经网络的框架,将其作为识别和生成中文字符的判别模型和生成模型,达到了 ICDAR-2013 竞赛数据库上的最先进效果。
Jun, 2016
本文提出一种手写生成对抗网络框架 (HWGANs),通过使用 CNN-LSTM 和隐变量生成模型可实现有效地生成手写序列数据,并且与传统手写生成器相比,可以生成更自然更逼真的手写文本。
Jul, 2019
本文介绍了一种支持 102 种语言的在线手写系统,采用深度神经网络架构和贝塞尔曲线的新输入编码,与之前的系统相比降低了 20%-40% 的错误率,并在 IAM-OnDB 数据集上取得了新的最优结果。通过实验确定了模型的最优配置,并在多个公共数据集上进行了评估。
Feb, 2019
本文提出了一种针对离线手写段落文本识别的神经网络模型,利用注意力权重计算图像表示,实现了一种隐式行分割的可训练端到端模型,试验结果表明其性能与传统基于线段的模型竞争力相当,具有将全文档转录实现的潜力。
本文提出了一种新的手绘草图表示方式,将其作为多个稀疏连接的图形,利用设计的多图变压器(MGT)进行学习,从多个图形中同时捕获全局和局部几何笔画结构以及时间信息;实验证明,该方法可用于在 Google QuickDraw 上进行草图识别,相对 CNN 性能上限的精度达到了 72.80%,且显著优于所有基于 RNN 的模型。
Dec, 2019