Apr, 2024
在 PyLaia 开源库中使用语言模型提升自动文本识别
Improving Automatic Text Recognition with Language Models in the PyLaia Open-Source Library
Solène Tarride, Yoann Schneider, Marie Generali-Lince, Mélodie Boillet, Bastien Abadie...
TL;DRPyLaia 是最受欢迎的开源自动文本识别(ATR)软件之一,最近改进包括可靠的置信度评分和解码过程中统计语言建模的整合,结果显示使用小型语言模型进行解码平均会将词错误率提高 13% 和字符错误率提高 12%。