May, 2022

BN-HTRd: 一份用于离线孟加拉文手写文本识别(HTR)和行分割的基准数据集

TL;DR该文章介绍了一个新的离线手写文本识别数据集,集中在孟加拉文字的图像上,该数据集包括 788 张手写页面图像和一个用于无监督聚类线分割的方案。该数据集可以用于各种手写文档识别、词识别、词或行分割等任务。