Sep, 2015

从对齐文本数据中提取的双语分布式词向量表示

TL;DR提出一种新的基于非平行文档对齐数据的学习双语词表示的模型,通过比较与多语言概率主题建模和分布式本地环境计数模型的方法,表明该模型可以从仅基于文档对齐可比数据学习。该模型可以用于双语词汇的词典项提取和多义词的单词翻译。