Mar, 2024

引入音节分词技术用于低资源语言:以斯瓦希里语为例研究

TL;DR我们提出了一种音节分词器,并采用实验为中心的方法验证所提出的分词器在斯瓦希里语中的有效性。我们使用 GPT2 进行文本生成实验,结果证明所提出的音节分词器能够有效地表示斯瓦希里语。