创建反向双语词典
本文提出了一种自动创建低资源语言,特别是资源贫乏和濒危语言的大量新双语词典的方法,使用一个单一的输入双语词典生成目标语言的单词翻译,依赖于 Wordnets 和机器翻译器(MT)。
Aug, 2022
本研究提出了一种基于双语词典的数据增强技术,使得机器翻译模型能够扩展词汇表而不会影响低资源环境下的合成句子的质量,我们的方法在性能上表现出可观的改进。
Apr, 2020
该研究提出了一种神经嵌入模型,利用双语词典将文字定义映射到双语目标词汇,探索不同的句子编码技术以及采用多任务学习和联合学习等关键学习策略来增强学习过程,实验结果表明,该模型在跨语言反向字典检索任务和双语释义识别问题上表现优异,并有效地解决了双语释义识别问题。
Aug, 2018
通过使用公开的 Wordnets、机器翻译和单语种双语字典,我们提出了一种方法来为资源丰富和资源贫乏的语言生成 Wordnet 同义词集,这些方法适用于至少存在一种从英文翻译到该语言的双语词典的任何语言,是自动构建完整 Wordnets 的第一步。
Aug, 2022
本文提出了一种基于 mT5 的 transformer 深度学习方法,采用翻译语言建模技术而非常用的掩码语言建模技术,实现了支持印度语言的开源跨语言反向字典系统。
Apr, 2022
本文研究怎样使用 BERT 模型来完成 Reverse Dictionary 的任务,并结合 Multilingual BERT 模型实现多语言反向词典转换,同时提出了一种有效的方法来解决 BERT 模型生成词的问题。该模型在没有平行语料库的情况下,也能够实现出色的跨语言反向词典性能。
Sep, 2020
本文介绍一种使用双语词典和神经机器翻译模型来改善极低资源语言翻译的方法,扩展到多语言系统,表现出零 - shot 特性,并分析词典质量、数据集大小、语言家族等因素对翻译质量的影响,结果表明,与基线相比,使用双语词典的方法在多个低资源测试语言上具有明显优势。
Jun, 2022
本文提出了一种自动化生成和扩展字典和短语表的方法,利用大规模单语数据学习语言结构和小型双语数据映射语言空间之间的线性映射,从而实现翻译缺失的单词和短语,能达到英语和西班牙语之间近 90% 准确率,可用于扩展和完善任何语言对的字典和翻译表。
Sep, 2013
本文使用端到端的 Siamese 双向递归神经网络从 Wikipedia 的可比较多语言文章中提取并生成平行句子,证明使用所收集的数据集可以提高低资源语言对 (英―印度语和英―泰米尔语) 上的 BLEU 分数。
Jun, 2018