关键词vector-based word representations
搜索结果 - 3
- 现有词嵌入方法的全面实证评估
本文通过对现有单词嵌入方法的特点和分类任务的分析,将单词嵌入方法划分为传统方法和基于神经网络的方法,揭示基于神经网络的单词表示方法相比于传统方法更能捕捉语言的语义和句法规律。实验验证了不同方法的性能差异。
- WSDM基于降秩岭回归的跨语言文档嵌入
本文介绍了一种新的跨语言文件嵌入方法 Cr5,它使用跨语言降维回归来在多语言文本语料库中将文档嵌入到单一、不依赖于语言的向量空间中。本方法使用奇异值分解作为核心操作,可扩展性极强,在跨语言文档检索任务中实现了最先进的性能。
- 通过缓解中心问题来改善零样本学习
该研究提出了一种简单的方法来解决 zero-shot 任务中邻居向量被强权向心性卡住的问题,即通过考虑多个向量中潜在邻居的相似度分布来校正错误结果。结果表明,这种校正方法在跨语言、图像标记和图像检索等领域的 zero-shot 任务中均获得