Jul, 2022

You Actually Look Twice At it (YALTAi): 在 Kraken 引擎内使用目标检测方法代替区域分割

TL;DR我们提出了使用等面矩形进行对象检测的方法,以替换基于像素分类的多边形化,从而更有效地完成光学字符识别中的版面分析任务。对历史文献进行测试时,使用 YOLOv5 的结果比 Kraken 更为优秀。我们提供了两个历史文献训练和评估数据集,并发布了一个新软件包,YALTAi,它将 YOLOv5 注入到 Kraken 4.1 的分割流程中。