Jul, 2018

通过格拉姆矩估算在大规模语料库上进行高效训练

TL;DR本文旨在解决使用神经网络嵌入模型学习非常大的语料库相似度函数的问题。我们提出了一种新的高效方法,通过添加全局二次惩罚项并将其表达为两个广义格拉姆矩阵的矩阵内积来训练这些模型,并开发了方差减少方案来提高估计质量。我们进行了大规模实验,结果表明与传统抽样方法相比,训练时间和泛化质量都有显着改善。