Dec, 2016

逆向双语主题模型用于从非平行数据中提取词库

TL;DR本文提出了两种新的双语主题模型,以更好地捕捉每个单词的语义信息,同时区分嘈杂的种子词典中的多个翻译,解决了应用主题模型到非平行数据的两个挑战:难以建模词语关系和嘈杂的种子词典。此外,我们还提出了有效的词语相似性评估措施和翻译选择概率。实验结果表明了所提出的模型的实用性和有效性。