创建反向双语词典

Aug, 2022

Creating Reverse Bilingual Dictionaries

Khang Nhut Lam, Jugal Kalita

TL;DR本文提出从已有的包含英语的双语词典中创建新的反向双语词典的算法，利用英语 Wordnet 中单词 - 概念对之间的相似性来生成反向词典条目，并且只要其中的一种语言具有 Wordnet 类型的词汇学本体论，这些算法就适用于任何双语词典。

Abstract

bilingual dictionaries are expensive resources and not many are available when one of the languages is resource-poor. In this paper, we propose algorithms for creation of new reverse →

bilingual dictionaries reverse dictionary wordnet algorithms lexical ontology

发现论文，激发创造

自动创建大量新的双语词典

本文提出了一种自动创建低资源语言，特别是资源贫乏和濒危语言的大量新双语词典的方法，使用一个单一的输入双语词典生成目标语言的单词翻译，依赖于 Wordnets 和机器翻译器（MT）。

Aug, 2022

为濒危语言创建词汇资源

本文旨在探讨为濒危语言生成词汇资源的方法，通过使用公共词网和机器翻译器构建双语词典和多语言词库，奠定了一个基础，尤其适用于缺乏资源的语言。

Aug, 2022

利用双语词典进行低资源半监督神经机器翻译

本研究提出了一种基于双语词典的数据增强技术，使得机器翻译模型能够扩展词汇表而不会影响低资源环境下的合成句子的质量，我们的方法在性能上表现出可观的改进。

Apr, 2020

学习表示双语词典

该研究提出了一种神经嵌入模型，利用双语词典将文字定义映射到双语目标词汇，探索不同的句子编码技术以及采用多任务学习和联合学习等关键学习策略来增强学习过程，实验结果表明，该模型在跨语言反向字典检索任务和双语释义识别问题上表现优异，并有效地解决了双语释义识别问题。

Aug, 2018

自动构建 Wordnet 同义词集

通过使用公开的 Wordnets、机器翻译和单语种双语字典，我们提出了一种方法来为资源丰富和资源贫乏的语言生成 Wordnet 同义词集，这些方法适用于至少存在一种从英文翻译到该语言的双语词典的任何语言，是自动构建完整 Wordnets 的第一步。

Aug, 2022

WordAlchemy: 基于 Transformer 的逆向字典

本文提出了一种基于 mT5 的 transformer 深度学习方法，采用翻译语言建模技术而非常用的掩码语言建模技术，实现了支持印度语言的开源跨语言反向字典系统。

Apr, 2022

BERT 用于单语和跨语言逆词典

本文研究怎样使用 BERT 模型来完成 Reverse Dictionary 的任务，并结合 Multilingual BERT 模型实现多语言反向词典转换，同时提出了一种有效的方法来解决 BERT 模型生成词的问题。该模型在没有平行语料库的情况下，也能够实现出色的跨语言反向词典性能。

Sep, 2020

基于双语词典的极低资源语言 NMT

本文介绍一种使用双语词典和神经机器翻译模型来改善极低资源语言翻译的方法，扩展到多语言系统，表现出零 - shot 特性，并分析词典质量、数据集大小、语言家族等因素对翻译质量的影响，结果表明，与基线相比，使用双语词典的方法在多个低资源测试语言上具有明显优势。

Jun, 2022

利用语言相似性进行机器翻译

本文提出了一种自动化生成和扩展字典和短语表的方法，利用大规模单语数据学习语言结构和小型双语数据映射语言空间之间的线性映射，从而实现翻译缺失的单词和短语，能达到英语和西班牙语之间近 90% 准确率，可用于扩展和完善任何语言对的字典和翻译表。

Sep, 2013

利用可比语料库诱导的双语词典进行低资源语言的神经机器翻译

本文使用端到端的 Siamese 双向递归神经网络从 Wikipedia 的可比较多语言文章中提取并生成平行句子，证明使用所收集的数据集可以提高低资源语言对 (英―印度语和英―泰米尔语) 上的 BLEU 分数。

Jun, 2018