Apr, 2019

利用子词信息学习词表示的系统研究

TL;DR本研究通过对五种语言的三个任务进行大量实验研究,发现在利用子词级别信息进行词表示学习时,不同语言和任务下,分词和组成函数等关键组件的最优配置各异。同时,我们还发现,一些无监督分词方法,如BPE和Morfessor等,有时能够和甚至超过一些基于监督分词方法的配置。