Oct, 2024

伊卡语的自动语音识别

TL;DR本研究针对低资源语言伊卡语,提出了一种成本效益高的自动语音识别(ASR)模型开发方法。通过对预训练的多语种wav2vec 2.0模型进行微调,结果表明该模型在仅用1小时训练数据的情况下取得了0.5377的字错误率和0.2651的字符错误率,展示了利用多语言预训练模型对低资源语言的潜力。