通过矩阵完成技术,以及在机器翻译任务中将最小贝叶斯风险解码(MBR)作为矩阵完成问题,本文提出了一种新的逼近 MBR 解码的方法。实验证明该方法在机器翻译任务中具有较高的效率,并达到了与 MBR 解码相当的翻译质量。
Jun, 2024
在文本生成任务中,我们提出了基于模型的 MBR(MBMBR)方法,它使用模型概率本身作为概率分布的估计值,通过理论和实验证明模型估计优于蒙特卡洛估计,并且在多个文本生成任务中,包括编码 - 解码模型和大型语言模型中,MBMBR 表现优于 MBR。
Nov, 2023
通过使用相关顺序减半算法来近似计算基于样本的最小贝叶斯风险目标,我们提出了一种不需要超参数调整的 AMBR 解码方法,该方法在机器翻译、文本摘要和图像字幕任务上与 CBP 方法相当。
Jan, 2024
本研究提出使用最小贝叶斯风险编解码技术 (MBR) 来消除基于 beam search 算法的模型自信度导致的输出错误,并使用 GPU 批量计算贝叶斯风险值以加速解码,并在机器翻译中验证后期 MBR 解码的优越性。
Apr, 2017
采用基于质心的最小贝叶斯风险解码方法可提高解码速度,并在翻译质量上超过标准的最小贝叶斯风险解码方法。
Feb, 2024
使用异常检测来衡量最小贝叶斯风险解码的核心假设与性能之间的联系。
Mar, 2024
在最小贝叶斯风险解码中,通过逐渐增加样本数来估计效用,并使用基于自助法的抽样获得的置信度估计来剪除不太可能具有最高效用的假设,从而在准确性方面与标准 MBR 无显著差异的情况下,需要较少的样本并大幅减少效用函数调用次数。
本论文探讨神经机器翻译中的偏差以及在域偏移和样本干扰下的弱点,并找到应用最小贝叶斯风险解码对抗这些问题的方案。结果表明,这个方法虽然仍有长度和频率偏差,但同样增加了模型的鲁棒性,对样本干扰和域偏移具有更好的适应能力
May, 2021
本研究分析了一种比 beam search 更有效的基于最小贝叶斯风险译码的决策规则,并设计了基于搜索和估计效用的成本分离近似算法,探讨了以模式为导向的策略对译文翻译的效果,实验证明这种方法在三种语言对中均能提高翻译质量。
Aug, 2021
本研究提出了一种基于源的 MBR 解码方法(sMBR),利用由后向翻译生成的合成源作为 “支持假设”,以及无参考质量估计度量作为效用函数,实现了仅利用源进行 MBR 解码的首次工作。实验证明,sMBR 明显优于 QE 重排并且与标准 MBR 解码相竞争。此外,与 MBR 相比,sMBR 较少调用效用函数的次数。结果表明,sMBR 是一种有潜力提高质量的 NMT 解码方法。