Jul, 2023

尼日利亚派金语的低资源跨语言自适应训练

TL;DR本研究针对低资源语言建设有效的口语处理系统提出了一个跨语言自适应训练框架,包括持续和任务自适应训练,以适应基于预训练模型的自然语言处理任务,采用英语预训练语言模型作为英语-Pidgin任务的强先验,取得了最高2.38的BLEU分数,加入正字法数据增强和反向翻译的任务自适应训练对模型性能有显著影响。