Oct, 2022

IsoVec:控制词嵌入空间的相对同构性

TL;DR本文提出一种通过在Skip-gram损失函数中加入全局同构度量来提高单语词向量空间同构性的方法以改进词向量之间的跨语言映射,从而实现对通用数据条件下的双语词典诱导、领域不匹配和训练算法不匹配的提高。