Jan, 2016

学习词向量中上下文类型和维度的作用

TL;DR本文通过对不同类型的上下文学习skip-gram词嵌入对广泛的内在和外在自然语言处理任务性能的首次全面评估,发现内在任务在特定类型的上下文和更高的维度方面更好,而对于大多数外在任务,需要更仔细的调整来找到最佳设置;另外,对于这些外在任务,一旦提高嵌入维度的好处大多用尽,使用不同上下文类型学习的简单词嵌入的串联,可以产生进一步的性能提升;此外,本文还提出了一种新的skip-gram模型变体,从替换词的加权上下文中学习单词嵌入。