Feb, 2024

专用模型和高级技术提升孟加拉光学字符识别在多样文档类型中的应用

TL;DR该研究提出了一种具有特殊能力的孟加拉语 OCR 系统,该系统在保留结构、对齐和图像的同时,在重建文档布局方面表现出色。它采用先进的图像和签名检测进行准确提取,并为文字分割提供了专门模型以适应多样化的文档类型,包括计算机排版、凸版印刷、打字机和手写文档。该系统处理静态和动态手写输入,识别各种写作风格。此外,它还能识别孟加拉语中的复合字符。广泛的数据收集工作提供了多样化的语料库,而高级技术组件优化了字符和单词识别。额外的贡献包括图像、标志、签名和表格识别,透视校正,布局重建以及用于高效和可扩展处理的排队模块。该系统在高效准确的文本提取和分析方面表现出色。