Sep, 2015

构建主题对齐的可比较语料库并挖掘其中真正的平行句对

TL;DR通过使用网页爬取方法和机器翻译系统,本文提出了一种从维基百科文章中获取主题对齐比较语料库的方法,并且能够提取噪音干扰较小的平行句子。