EMNLPAug, 2018

预训练词向量、字符模型和词性标注在依存句法分析中的相互作用研究

TL;DR本文通过对预训练词向量、字符模型和 POS 标签在基于转移的依赖分析器中的相互作用进行综合分析,认为它们之间存在复杂的相互作用,并且在分别应用它们时,均较使用随机初始化的词向量的基线系统都有了大幅度的改进,但组合它们很快就会显得变得没有预期的好,特别是在具有丰富形态的低频开放类词汇和有歧义性的高频功能词之间,将它们灵活组合使用可以得到同样的结果,同时对于具有小字符集的语言,尤其是对于形态丰富的语言,大的字符嵌入大小也有助于提高依赖分析的品质