COLINGNov, 2020

一种简单而有效的稳健非监督双语词典归纳方法

TL;DR本研究针对无监督双语词典归纳在类似语言对中表现良好但在远距离语言对中表现不佳的问题,提出迭代降维方法以此来弥补自学习最小初始化性能和实际初始化性能之间的差距,其实验结果表明这种简单的方法在类似语言对中不会影响性能,并在英语与中文,日语,越南语和泰语四种较远距离语言之间实现了 13.64-55.53% 的准确率。