本文提出了一种集成方法,通过将 GloVe 和 word2vec 的嵌入方式与语义网络 ConceptNet 和 PPDB 的结构化知识相结合,将它们的信息融合成一个具有大型多语言词汇的共同表示,并达到了许多词语相似性评估的最先进性能
Apr, 2016
本文研究了使用银行特定语料库构建的词嵌入,相对于使用文本语料库构建的 Word2Vec 或 BERT 嵌入,银行特定语料库的嵌入在银行特定语义和词相关性的捕捉方面表现更好,因此可能成为银行业特定 NLP 任务的一种有效数据源。
Jun, 2023
本文系统研究了几种静态词向量嵌入中单词频率与语义相似性之间的关联,并发现高频单词之间的相似性更高。同时,本文还探究了单词频率对基于嵌入的性别偏见测量的影响,并证明通过操纵单词频率可使偏见发生倒转。
Nov, 2022
本文研究了基于词嵌入的语义相似度计算方法,提出了一种基于排名的度量方法,在相似度测量和异常值检测方面表现良好,表明基于排名的度量方法可以提高聚类质量。
May, 2018
从原始语音中,无监督地提取固定长度的向量表示语音片段的语义信息,通过 RNN 编码器 - 解码器模型和连续 Skip-Grams 方法进行训练,并在 13 个常用词汇相似度基准测试中获得了和 GloVe 相媲美的结果。
Nov, 2017
该研究提出了一种理论方法,将词嵌入和知识图谱中的实体及其关系的几何形状联系起来,以便更好地理解它们的语义结构和性能。
Feb, 2022
通过使用德语数据作为案例研究,我们使用语素标注数据引导连续单词嵌入,使嵌入空间中的接近词彼此共享语素特征,并展示了我们学习得到的嵌入实现了这一目标。
Jul, 2019
使用 word2vec 计算模型探索多种风格音乐的语义信息,研究显示这种新的嵌入矢量表征实际上捕捉到了音乐的音调和和声特性,为深度学习模型提供了潜在的输入表示,并提供了音乐创作工具。
Nov, 2018
本文研究了词嵌入在查询扩展中的应用,结果表明全局训练的 Word2Vec 和 GloVe 等词嵌入不能很好地完成信息检索任务,建议其他使用全局嵌入的任务也可以受益于使用局部嵌入。
May, 2016
本研究提出 path2vec,一种学习图嵌入的新方法,它依赖于节点相似性的结构度量,该模型使用一个密集的空间来学习节点的表示,以逼近用户定义的图距离度量,并在语义相似性和词义消歧任务方面表现出色。
Aug, 2018