相关语言之间基于子词级短语的 SMT 的更快解码
本研究提出了一种将传统 SMT 模型与神经机器翻译相结合的方法,从而提高翻译质量。该方法利用现有的基于短语的 SMT 模型计算基于短语的解码成本,并将其用于重新排列 n 个最佳 NMT 输出。研究表明,利用强制解码成本对 NMT 输出进行排序可以成功提高四种不同语言的翻译质量。
Nov, 2017
本文提出了一种方法将基于统计的短语机器翻译方法中存储的目标短语与神经机器翻译模型的编码器 - 解码器结构相结合,其中短语记忆被动态地生成,提供上下文信息,以进行短语翻译,实现了中英文翻译的显著提升。
Aug, 2017
本论文研究了如何通过采用轻量级解码器和词汇筛选来加速多语言神经机器翻译的推理速度,而不影响翻译质量,使用 BLEU 和 chrF 进行实验验证,并进行了健壮性评估和人类评估。
Sep, 2021
该研究提出了一种称为子词分节机器翻译(SSMT)的新方法,通过在单个可训练模型中联合学习目标句子单词的分割和目标句子生成,在生成翻译过程中采用动态解码算法进行细分操作,实验结果表明,SSMT 能提高粘着语言的 chrF 分数以及对于评估形态组成通用性构建的测试集的鲁棒性也更强。
May, 2023
本文研究了基于短语的语言模型,针对机器翻译使用引入了全面的基于短语的语言模型,并通过初步实验结果表明,相比于基于单词的语言模型,我们的方法在困惑度和翻译质量方面表现更好。
Jan, 2015
本文提出一种自动调节神经机器翻译中分词粒度的方法,可以在训练的同时引入新的词汇并优化语言分割,最终达到与最优表现相似的结果,并在训练效率和罕见词汇的表现方面带来了改进。
Oct, 2018
该研究着眼于汉字与英文字母等不同书写语言之间的差异,并使用了一种简单的方法来利用汉字更细致的结构信息,以提高神经机器翻译系统的性能。结果表明,这种方法不仅改进了汉英翻译,还进一步改进了汉日翻译,因为它利用了类似汉字部首的共享信息。
Sep, 2018
通过实验研究,我们发现在资源有限的情况下,从字符级识别转化成单词级可以显著提高低资源语言语音翻译的速度,并且在训练数据相对较少的情况下,仍然可以实现相对较高的词汇精度和召回率。
Mar, 2018