EMNLPSep, 2016
数据规模和频率范围对分布语义模型的影响
The Effects of Data Size and Frequency Range on Distributional Semantic Models
Magnus Sahlgren, Alessandro Lenci
TL;DR本研究旨在探究数据规模和频率范围对分布语义模型的影响。比较了几种代表性模型在不同规模的数据和各种不同频率的测试项下的性能表现。结果表明,当数据规模较小时,基于神经网络的模型表现不佳,而在各种规模和频率范围的数据下,可靠性最高的模型是倒置分解模型。