NIPSNov, 2019

词嵌入的不变性和可识别性问题

TL;DR在文本语料库中,词嵌入常常作为 $f$ 准则函数的优化器获得,但在用于测试数据的词任务性能方面评估时使用的是不同的评估函数 $g$。本文认为造成性能差异的一个可能原因是在保持 $f$ 和 $g$ 不变的变换类之间的不兼容。因此,本文对上述可识别性问题进行了正式的处理,提出了一些数字实例,并讨论了可能的解决方案。