Apr, 2024

用于尼泊尔语序列语言模型的标记化效果对微调性能的预测能力调查

TL;DR使用 6 种不同的分词方案预先训练了相对较小的尼泊尔语言模型,并发现相比于字节级 BPE 算法,SentencePiece 等算法在尼泊尔的微调性能上表现更好。此外,我们还预先训练和微调了基于顺序转换器的语言模型。