Apr, 2023

通过近缘语言进行向低资源语言的转移:以法罗语为例的案例研究

TL;DR通过研究低资源语言法罗语和高资源语言家族之间的语言分类、起源和进化关系,将在多语言语境下的 NLP 应用中常用的 “一刀切”(one-size-fits-all) 的翻译方式转变为提供更高的翻译准确度,同时利用丰富的斯堪的那维亚语言(丹麦语、挪威语、瑞典语和冰岛语)的资源来为 Faroeese 语提供支持,其结果表明可以大幅提高向低资源语言法罗语的翻译性能,并开发了一个新的 web Farosee 语料库,并提供命名实体识别(NER),语义文本相似度(STS)和所有斯堪的那维亚语言训练的新语言模型的数据集。