Jul, 2017

ShotgunWSD: 一种类似 DNA 测序的无监督全局词义消歧算法

TL;DR本文介绍了一种新颖的无监督算法,用于文档级别的词义消歧。该方法受到了遗传学领域中用于全基因组测序的Shotgun测序技术的启发,其基于三个主要步骤:在文档中选择较短的上下文窗口,并应用暴力消歧算法生成每个窗口的可能义项列表;基于后缀和前缀匹配将本地义项配置组成长的复合配置;通过投票方案选择每个单词的义项。我们将该算法与其他最先进的无监督词义消歧算法进行了比较,并证明了其更好的性能,有时甚至有很大的差距。