拉丁文字排版的自下而上文本行分割程序

MMOct, 2017

拉丁文字排版的自下而上文本行分割程序

A Bottom Up Procedure for Text Line Segmentation of Latin Script

Himanshu Jain, Archana Praveen Kumar

TL;DR本文介绍了一种自下而上的方法，用于对拉丁文字体写或印刷的文本行进行分割，该方法采用图像形态学，特征提取和高斯混合模型的组合来执行此任务，并实验证明了该程序的有效性。

Abstract

In this paper we present a bottom up procedure for segmentation of text lines written or printed in the latin script. The proposed method uses a combination of image morphology, →

text segmentation latin script image morphology feature extraction gaussian mixture model

发现论文，激发创造

历史文献的文本行分割：一份调查报告

本文调研了历史文献数字化领域的文献分割、文本行分割、文字检索、鉴定和提取等方面所采用的各种方法，讨论了低质量和复杂性文献自动文本行分割的挑战。

Apr, 2007

端到端手写段落识别的联合分割和转录

本文提出了一种针对离线手写段落文本识别的神经网络模型，利用注意力权重计算图像表示，实现了一种隐式行分割的可训练端到端模型，试验结果表明其性能与传统基于线段的模型竞争力相当，具有将全文档转录实现的潜力。

Apr, 2016

利用文本分割和深度卷积序列从自然场景图像中离线提取印度区域语言

本文提出了一种通过图像纠正和分割以及使用深度学习技术进行文本识别和自然语言处理的方法，以从自然现场图像中提取区域语言信息，相比现有方法具有更好的性能。

Jun, 2018

历史文献中文本行检测的两阶段方法

本文提出了一种用于历史文献的文本行检测方法，采用了两种阶段的方法，第一阶段使用了一个名为 ARU-Net 的深度神经网络进行像素的分类，第二阶段则采用自底向上的聚类算法进行 Baseline 的建立，该方法在复杂布局、曲线和任意方向文本行方面具有出色的性能和表现。

Feb, 2018

无监督发现词素

本研究提出了两种方法来对单词进行无监督分词，特别适用于富有形态学的语言，如芬兰语。第一种方法基于 MDL 原则并且可以在线进行。在第二种方法中使用了最大似然 (ML) 优化。比较所得到的分割和现有的形态分析，证明这些方法在芬兰语和英语语料库上表现良好，相对于现有的一流系统而言。

May, 2002

文本分割作为监督学习任务

本研究利用维基百科文章，将文本分割任务作为有监督学习问题进行探究，提出了一个基于这个数据集的文本分割模型，并展示了其在未见过的自然文本上的泛化能力。

Mar, 2018

分割混乱文本：检测从历史报纸影像中提取的文本边界

利用深度学习模型，我们在处理光学字符识别的历史报纸图片中的婚姻公告数据的文本分割任务上，表现显著优于现有技术。

Dec, 2023

MorphText：深度形态规范任意形状场景文本检测

利用深度形态学和深度形态开合模块解决文本部分误检测和建立文本连接的问题，提出了一种名为 “MorphText” 的新方法，实验证明它在任意形状场景文本检测方面优于现有的自上而下和自下而上方法。

Apr, 2024

使用关注力的无监督语音词语切分

这篇研究是对注意力词分割的首次尝试，通过从语音信号中直接进行词分割，最终目标是在低资源的口头语言中自动识别词汇单位。该方法假定在 UL 语言中的记录与资源充足的语言中的翻译相配对。使用声学单元发现（AUD）将语音转换为伪音段序列，然后使用神经机器翻译模型产生的神经软对齐来分割语音。该研究使用班图语 Mboshi 作为实际的 UL，并与单语和双语基线进行比较，说明了注意力词分割在语言记录方面的潜力。

Jun, 2018

使用混合视觉和文本语言模型实现 19 世纪法国贸易目录的分录分离

本研究提出了一种基于 Named Entity Recognition（NER）的细粒度条目分离阶段方法，可同时利用文本和视觉知识，用于从重复组织的文档中提取结构化数据，如字典、目录或报纸，实验结果表明该方法在 19 世纪法国商业目录中效果显著。

Feb, 2023