Apr, 2022

运用语言类型学丰富多语言词汇表:以亲属关系中的词汇空缺为例

TL;DR该论文描述了一种基于词汇类型学知识来增强词汇资源与语言多样性相关内容的方法,通过半自动化的系统方法来推断词汇差距,从而建立一个包含 198 个领域概念、1911 个单词和 37370 个差距的词汇语义资源,该资源涵盖了 699 种语言,并说明了该资源对于改善跨语言 NLP 任务具有潜在价值。同时,为证明该资源的可行性,利用该词库开发了一个 MT 系统评估程序。