Mar, 2024

IndicSTR12:印度场景文字识别数据集

TL;DR在印度语言这个复杂、语法和语义上更复杂的领域,由于缺乏综合的数据集,该研究提出了最大最全面的数据集 IndicSTR12,并在 12 种主要印度语言上进行了场景文本识别的性能评估,该数据集与现有的拉丁语言的数据集规模和复杂性相当,并且其多语言性将促进鲁棒的文本检测和识别模型的发展。