Apr, 2020

基于指南针对齐的分布式嵌入,用于研究语料库间的语义差异

TL;DR本文提出了一个通用框架,用于支持使用单词嵌入进行跨语料库的语言研究,其中可以比较从不同语料库生成的嵌入项,以找出语料库之间的含义对应和差异。该框架的核心组件是 CADE,重点解决了从不同语料库生成的嵌入项的对齐问题。经过实验,结果表明 CADE 在时间词嵌入,语言本地化和主题分析等各个领域都达到了最先进或更优异的性能。