英印机器翻译重排序规则
许多研究已经发表了关于如何在统计机器翻译中处理单词重排序的问题,然而,这个领域还有很多挑战需要面对,因此作者提出了一种综合性的调查来描述如何在不同的 SMT 框架和作为单独的任务中对单词重排序进行建模,并通过基于大量语言知识的定性分析,论证了在不同语言对中选择最适合他们的 SMT 框架时,一些语言事实可以非常有用。
Feb, 2015
本文介绍了使用 SMT 技术和 MOSES 工具包开发双语 SMT 模型,实现英语和十五种低资源印度语言之间的翻译,包括使用 BLEU,METEOR 和 RIBES 等标准指标对翻译质量进行评估。
Jan, 2023
本文旨在探究各种参数设置下最先进的统计机器翻译系统,以提高像英语 - 印地语这样的 “远距离” 语言对翻译的质量,并提出了新的有效的重排序技术和简单预处理步骤,以显著改善翻译结果的质量。
Jan, 2014
本文介绍了基于 Tree-to-String 模型的重新排序系统,并使用公开工具来完成任务。我们使用 Moses 工具包构建了翻译模型,然后应用 Moses 中的 Chart Decoder 对句子进行重新排序。通过实验发现,该方法在不同语言对组合中的 BLEU、Kendall-Tau 和 Hamming 指标上均有显著改善,同时提出了进一步改进的可能方向。
Feb, 2013
本文介绍了一种新的重排序方法,利用神经网络和基于依存性的嵌入来预测两个源单词之间的依存关系,以确定翻译的单词顺序,实现了在中英翻译中统计显著的 0.57 BLEU 分数的提高。
Feb, 2017
本文介绍了如何使用双语平行数据集来模拟目标语序,在改进了位置编码机制的基础上,提出了一种新的序列重排序方法来显式地模拟源语句子的重排序信息,同时实验证明,该方法在多种翻译任务中均有效。
Apr, 2020
本文使用 LSTM 循环神经网络,建立了一种基于单词对和对齐的新型神经排序模型,成功地解决了机器翻译中的重排序问题,并在 NIST OpenMT12 测试中实现了显著性能提升。
Dec, 2015
使用依赖通用模式的强大重排序方法,能从少量的标注数据中学习到依赖语法上下文的精细词序模式,并在所有语法树的层级上应用,通过实验验证在零样本和少样本场景下相比强基准模型始终有优势。
Oct, 2023
通过研究 NMT 模型训练过程中的能力表现,发现其在学习目标语言模型、逐词翻译和复杂重排序模式方面的能力表现与传统的 SMT 模型有明显差异,并探讨了这种理解对于优化 NMT 模型的实际应用。
Sep, 2021
本文研究了使用分层短语配对 SMT 网络在端到端的神经机器翻译(NMT)中的应用。通过权重推送将完整的翻译预测假设的 Hiero 分数,包括完整的翻译语法分数和完整的 n-gram 语言模型分数,转换为与 NMT 预测概率兼容的后验概率,并通过稍加修改的 NMT 波束搜索解码器,发现了比 Hiero 和 NMT 单独解码的改进,在扩展 NMT 到非常大的输入和输出词汇方面具有实际优势。
May, 2016