Apr, 2024

在 PyLaia 开源库中使用语言模型提升自动文本识别

TL;DRPyLaia 是最受欢迎的开源自动文本识别(ATR)软件之一,最近改进包括可靠的置信度评分和解码过程中统计语言建模的整合,结果显示使用小型语言模型进行解码平均会将词错误率提高 13% 和字符错误率提高 12%。