BriefGPT.xyz
大模型
Ask
alpha
关键词
multilingual word embeddings
搜索结果 - 4
使用锚点和一系列相关语言的多语言词嵌入:面向低资源语言
通过一种基于语言链的新方法构建多语言词嵌入(MWEs),该方法通过中间相关语言弥合远源和目标的差距。我们通过在语言链中逐个添加每种语言,从资源丰富的源语言开始,构建 MWEs。我们将半联合双语方法扩展到多种语言,以消除以前工作的主要弱点,即
→
PDF
7 months ago
EMNLP
SimAlign: 使用静态和上下文嵌入实现高质量的单词对齐,无需并行训练数据
本文提出了一种无需平行数据就能进行词对齐的方法,基于多语言词嵌入,可以用于统计和神经机器翻译以及跨语言注释投影等任务。结果表明,使用词嵌入创建的对齐效果比传统统计对齐器效果更好,即使是在有丰富的平行语料的情况下。
PDF
4 years ago
EMNLP
无监督多语言词向量
提出了一种全新的多语言词向量空间的无监督学习框架,该框架可以直接捕捉不同语言之间的交互关系,从而显著提高多语种单词转换和跨语种单词相似度的效果,并且比使用跨语种资源的监督式方法表现更好。
PDF
6 years ago
八种语言多语言文档分类语料库
本篇研究提出了一种新的 Reuters 子语料库,其针对 8 种语言具有平衡的类先验分布,旨在通过使用多语言词向量和句子嵌入来提供跨语言文档分类的基线,并促进该重要领域的研究。
PDF
6 years ago
Prev
Next