BriefGPT.xyz
Ask
alpha
关键词
cross-lingual sentence embeddings
搜索结果 - 3
ACL
利用词对齐改进低资源语言的跨语言句子嵌入
跨语言句子嵌入领域最近取得了很大的进展,但是由于平行语料的稀缺性,对于低资源语言的研究相对滞后。本文表明当前模型中低资源语言的跨语言词表示与高资源语言的对齐程度明显不足。为了解决这个问题,我们引入了一种新的框架,通过使用现成的词对齐模型,显
→
PDF
3 months ago
使用网络抓取的数据微调 Kalaallisut - 英语机器翻译系统
本文介绍了如何利用多语言网站数据,构建 Kalaallisut 语言和英语之间的机器翻译模型并生成合成语料库,同时也讨论了如何利用单语 Kalaallisut 数据以及未来的研究方向和可能性。
PDF
2 years ago
ACL
基于跨语言句子移位距离的大规模多语言文档对齐
本文提出一种基于跨语言句嵌入的无监督打分函数,用于计算不同语言中文档之间的语义距离,从而指导文档对齐算法以适当地匹配跨语言 Web 文档,并在不同语言对中显著提高对齐效果。
PDF
4 years ago
Prev
Next