Apr, 2023

清洗珠:基于 Google OCR 藏文手稿的神经拼写校正模型

TL;DR本篇论文介绍了一种使用 OCR 技术对西藏手稿进行数字化处理并采用神经拼写纠正模型进行自动纠正噪声输出的方法, 通过 Transformer + 置信度得分机制,证明该方法比 Transformer,LSTM-2-LSTM 和 GRU-2-GRU 架构更为优越,为人文社科领域研究提供了方便。