May, 2023

BN-DRISHTI:通过手写文本实例级分割实现孟加拉文档识别

TL;DR本文介绍了一个新的深度学习方法 (BN-DRISHTI),它结合了基于 YOLO 的物体检测框架、Hough 变换和仿射变换来解决孟加拉语手写体识别的线条和单词分割问题,同时还提供了一个包含 786 张手写孟加拉语文档图像的扩展数据集 (BN-HTRd) 以及相应的线条和单词级别注释,用于单词识别的地面实况。该方法的在测试部分上得到了非常高的线条 (99.97%) 和单词 (98%) 分割 F 分数,表现优于外部三个孟加拉手写数据集。