Mar, 2023

超越负采样的高效分布式表示

TL;DR本文提出了一种学习分布式表示的有效方法,该方法通过最小化类似于 Word2Vec 算法中引入并在后来的工作中采用的目标函数来实现,其优化计算瓶颈是需要进行一定数量的操作来缩放到与样本大小成二次正比的 softmax 标准化常数。然而,本文的贡献在于展示 softmax 标准化常数可以在线性时间内估计,从而允许我们设计一种有效的优化策略来学习分布式表示,同时取得与负采样相比竞争性的准确性表现,但计算时间相对较短。