Aug, 2022

BSpell:基于 CNN 和 BERT 的孟加拉语拼写检查器

TL;DR本文提出了一种专用于孟加拉语单词拼写检查的 BERT 模型 BSpell,并采用了专用 CNN 子模型 SemanticNet 和混合预训练方案,使其在存在拼写错误的情况下实现了高度变形的孟加拉语词汇的 91.5%的精度,在两个孟加拉语和一个印地语的拼写纠正数据集上的详细比较表明了 BSpell 的优越性。