BriefGPT.xyz
大模型
Ask
alpha
关键词
lexicon induction
搜索结果 - 4
半监督学习用于双语词典归纳
无监督和半监督学习方法在词向量、双语词汇归纳以及排名问题方面取得了重要进展。
PDF
5 months ago
EMNLP
神经机器翻译的代码切换预训练
提出了一种新的预训练方法 Code-Switching Pre-training(CSP),它通过利用源语言和目标语言之间的跨语言对齐信息来预先训练神经机器翻译模型,该方法通过无监督的词嵌入映射词典识别源语言和目标语言之间的单词替换,克服了
→
PDF
4 years ago
ACL
跨语言嵌入是否应以英语为主?
通过研究跨语言词嵌入,本文关注了跨语言词典诱导及其评价指标,并发现了 Anglocentric 实验的局限性,同时提供了适用于所有语言的强大跨语言嵌入的指导方针。
PDF
5 years ago
通过词表归纳进行神经机器翻译的领域适应
本文提出了一种无监督的自适应方法,使用伪域内语料库通过微调预先训练的域外 NMT 模型,借助词典诱导提取域内词汇,并通过针对性的单语域内目标句子进行逐词反向翻译构建伪平行域内语料库,在 20 对自适应设置和两种模型架构的五个领域中,我们的方
→
PDF
5 years ago
Prev
Next