拉丁文字排版的自下而上文本行分割程序
本文提出了一种针对离线手写段落文本识别的神经网络模型,利用注意力权重计算图像表示,实现了一种隐式行分割的可训练端到端模型,试验结果表明其性能与传统基于线段的模型竞争力相当,具有将全文档转录实现的潜力。
Apr, 2016
本文提出了一种通过图像纠正和分割以及使用深度学习技术进行文本识别和自然语言处理的方法,以从自然现场图像中提取区域语言信息,相比现有方法具有更好的性能。
Jun, 2018
本文提出了一种用于历史文献的文本行检测方法,采用了两种阶段的方法,第一阶段使用了一个名为 ARU-Net 的深度神经网络进行像素的分类,第二阶段则采用自底向上的聚类算法进行 Baseline 的建立,该方法在复杂布局、曲线和任意方向文本行方面具有出色的性能和表现。
Feb, 2018
本研究提出了两种方法来对单词进行无监督分词,特别适用于富有形态学的语言,如芬兰语。第一种方法基于 MDL 原则并且可以在线进行。在第二种方法中使用了最大似然 (ML) 优化。比较所得到的分割和现有的形态分析,证明这些方法在芬兰语和英语语料库上表现良好,相对于现有的一流系统而言。
May, 2002
利用深度形态学和深度形态开合模块解决文本部分误检测和建立文本连接的问题,提出了一种名为 “MorphText” 的新方法,实验证明它在任意形状场景文本检测方面优于现有的自上而下和自下而上方法。
Apr, 2024
这篇研究是对注意力词分割的首次尝试,通过从语音信号中直接进行词分割,最终目标是在低资源的口头语言中自动识别词汇单位。该方法假定在 UL 语言中的记录与资源充足的语言中的翻译相配对。使用声学单元发现(AUD)将语音转换为伪音段序列,然后使用神经机器翻译模型产生的神经软对齐来分割语音。该研究使用班图语 Mboshi 作为实际的 UL,并与单语和双语基线进行比较,说明了注意力词分割在语言记录方面的潜力。
Jun, 2018
本研究提出了一种基于 Named Entity Recognition(NER)的细粒度条目分离阶段方法,可同时利用文本和视觉知识,用于从重复组织的文档中提取结构化数据,如字典、目录或报纸,实验结果表明该方法在 19 世纪法国商业目录中效果显著。
Feb, 2023