该研究提出了一种将神经机器翻译(NMT)与传统的统计机器翻译(SMT)相结合的新方案,利用贝叶斯风险进行组合,并成功地在英德和日英翻译方面得到了显著的提升。
Dec, 2016
本研究提出使用最小贝叶斯风险编解码技术(MBR)来消除基于beam search算法的模型自信度导致的输出错误,并使用GPU批量计算贝叶斯风险值以加速解码,并在机器翻译中验证后期MBR解码的优越性。
Apr, 2017
本论文探讨神经机器翻译中的偏差以及在域偏移和样本干扰下的弱点,并找到应用最小贝叶斯风险解码对抗这些问题的方案。结果表明,这个方法虽然仍有长度和频率偏差,但同样增加了模型的鲁棒性,对样本干扰和域偏移具有更好的适应能力
May, 2021
本研究分析了一种比beam search更有效的基于最小贝叶斯风险译码的决策规则,并设计了基于搜索和估计效用的成本分离近似算法,探讨了以模式为导向的策略对译文翻译的效果,实验证明这种方法在三种语言对中均能提高翻译质量。
Aug, 2021
机器翻译中心于神经机器翻译的MAP解码,本文提出基于近期普及的基于参考文本和无参考文本翻译质量评估研究成果,包括n-best重排序和最小贝叶斯风险解码等,实现了基于质量的神经机器翻译解码,经过多组数据集比较和人工评估,结果表明质量感知的神经机器翻译解码性能优于基于MAP的解码方法,且代码已公开。
May, 2022
本文研究了Minimum Bayes Risk (MBR)解码的不同采样方法对性能的影响,并通过人类评测,证明了基于epsilon采样的MBR解码在四种语言对中显著优于其他采样方法下的MBR解码和beam search解码。
May, 2023
在神经机器翻译模型中,提出通过自我评估来训练模型以估计其自身输出的质量,并在解码过程中使用该质量估计来指导生成过程,从而显著提高翻译质量。在最小贝叶斯风险解码中使用内部质量估计来剪枝,不仅可以进一步提高翻译质量,还可以将推理速度降低两个数量级。
Oct, 2023
在最小贝叶斯风险解码中,通过逐渐增加样本数来估计效用,并使用基于自助法的抽样获得的置信度估计来剪除不太可能具有最高效用的假设,从而在准确性方面与标准MBR无显著差异的情况下,需要较少的样本并大幅减少效用函数调用次数。
Nov, 2023
本研究提出了一种基于源的MBR解码方法(sMBR),利用由后向翻译生成的合成源作为“支持假设”,以及无参考质量估计度量作为效用函数,实现了仅利用源进行MBR解码的首次工作。实验证明,sMBR明显优于QE重排并且与标准MBR解码相竞争。此外,与MBR相比,sMBR较少调用效用函数的次数。结果表明,sMBR是一种有潜力提高质量的NMT解码方法。
Jun, 2024
该研究针对机器翻译系统中重排序候选列表所需的高计算成本问题提出了解决方案。研究者将重排序视为贝叶斯优化问题,通过选择一部分候选项进行评分,平衡探索与利用,显著减少了评分次数,仍然能达到与基线相当的质量评分。这一方法在提高资源利用效率的同时,显示出对机器翻译质量的潜在提升效果。
Nov, 2024