关键词bilingual dictionaries
搜索结果 - 11
- 基于图的词向量空间相对同构
使用单语嵌入空间自动构建双语词典是机器翻译中的核心挑战,现有的尝试未能考虑语义相关词对于多个空间的相对同构性的影响。为解决这一问题,我们提出了 GRI,通过结合分布式训练目标和注意力图卷积来同时考虑语义相似词对于定义和计算多个空间的相对同构 - 基于词典短语级别的大语言模型提示用于机器翻译
本研究通过利用双语词典的先验知识提供提示,提出了一种新的 DiPMT 方法,可以有效解决 LLM 在低资源机器翻译和领域转移情况下难以翻译生僻词的问题,并且实验结果表明 DiPMT 能够提高 LLM 的翻译性能。
- 计算机辅助模拟九世纪《教会福音书》双语词汇索引
该研究讨论中世纪翻译的双语词典发展,针对源语言和目标语言的不对称性以及原始和翻译文本不同的来源,提出了一种解决方法,并以保加利亚语作为案例进行研究。
- 自动创建大量新的双语词典
本文提出了一种自动创建低资源语言,特别是资源贫乏和濒危语言的大量新双语词典的方法,使用一个单一的输入双语词典生成目标语言的单词翻译,依赖于 Wordnets 和机器翻译器(MT)。
- 为濒危语言创建词汇资源
本文旨在探讨为濒危语言生成词汇资源的方法,通过使用公共词网和机器翻译器构建双语词典和多语言词库,奠定了一个基础,尤其适用于缺乏资源的语言。
- 创建反向双语词典
本文提出从已有的包含英语的双语词典中创建新的反向双语词典的算法,利用英语 Wordnet 中单词 - 概念对之间的相似性来生成反向词典条目,并且只要其中的一种语言具有 Wordnet 类型的词汇学本体论,这些算法就适用于任何双语词典。
- 基于双语词典的极低资源语言 NMT
本文介绍一种使用双语词典和神经机器翻译模型来改善极低资源语言翻译的方法,扩展到多语言系统,表现出零 - shot 特性,并分析词典质量、数据集大小、语言家族等因素对翻译质量的影响,结果表明,与基线相比,使用双语词典的方法在多个低资源测试语言 - EMNLP基于字典异构图的跨语言文本分类转移
本文提出了一种使用高资源语言的任务无关单词嵌入和双语词典来完成跨语言分类任务的方法,具体实现为通过构建基于词典的异构图和引入两级聚合的 DHGNet 这一图神经网络模型。实验结果表明,该方法在准确度方面优于预训练模型,且对于翻译错误具有一定 - ACL使用双语词典进行神经机器翻译的持续学习
该研究提出了一个评估框架,旨在评估神经机器翻译对持续学习新短语的能力,对不同的单词表示进行了单次学习方法的集成,并表明,必须解决这两个挑战才能成功使用双语词典。通过解决这两个挑战,我们能够将翻译新的、罕见的词汇和短语的能力从 30% 提高到 - 利用双语词典进行低资源半监督神经机器翻译
本研究提出了一种基于双语词典的数据增强技术,使得机器翻译模型能够扩展词汇表而不会影响低资源环境下的合成句子的质量,我们的方法在性能上表现出可观的改进。
- COLING命名实体音译中的设计挑战
本文探讨了多语种最新命名实体转写系统的一些基本设计挑战,并使用传统的加权有限状态转换器方法对两种神经方法进行实证评估:编码器 - 解码器循环神经网络方法和最近的非顺序 Transformer 方法。为了提高双语命名实体转写数据集的可用性,我