ACLOct, 2021

大规模基于替换的词义归纳

TL;DR本文提出一种基于预训练掩码语言模型(MLMs)的词义归纳方法,可以扩展到大词汇和大语料库,其结果是一个按语料库导出的意义清单进行感知标记的语料库,每个意义将与指示性单词相关联,通过在此感知标记语料库上训练静态单词嵌入算法,我们获得了优质的静态感知嵌入。这种数据驱动算法的本质可用于感知特定于语料库的感觉,正如我们在科学领域的案例研究中所证明的那样。