线性时间最小贝叶斯风险解码与参考汇聚

Feb, 2024

线性时间最小贝叶斯风险解码与参考汇聚

Linear-time Minimum Bayes Risk Decoding with Reference Aggregation

Jannis Vamvas, Rico Sennrich

TL;DR提出一种将成对度量分数近似为与聚合参考表示相对比的方法，从而将效用度量的复杂度从二次降低到线性，同时在实证中保留大部分 MBR 解码所带来的质量提升。

Abstract

minimum bayes risk (MBR) decoding is a text generation technique that has been shown to improve the quality of machine translations, but i

minimum bayes risk text generation machine translations sampling-based approximation utility metric

发现论文，激发创造

使用低秩矩阵补全算法进行高效最小贝叶斯风险解码

通过矩阵完成技术，以及在机器翻译任务中将最小贝叶斯风险解码（MBR）作为矩阵完成问题，本文提出了一种新的逼近 MBR 解码的方法。实验证明该方法在机器翻译任务中具有较高的效率，并达到了与 MBR 解码相当的翻译质量。

Jun, 2024

基于模型的最小贝叶斯风险解码

在文本生成任务中，我们提出了基于模型的 MBR（MBMBR）方法，它使用模型概率本身作为概率分布的估计值，通过理论和实验证明模型估计优于蒙特卡洛估计，并且在多个文本生成任务中，包括编码 - 解码模型和大型语言模型中，MBMBR 表现优于 MBR。

Nov, 2023

快速最小贝叶斯风险解码的无超参数方法

通过使用相关顺序减半算法来近似计算基于样本的最小贝叶斯风险目标，我们提出了一种不需要超参数调整的 AMBR 解码方法，该方法在机器翻译、文本摘要和图像字幕任务上与 CBP 方法相当。

Jan, 2024

神经机器翻译的后期最小贝叶斯风险解码

本研究提出使用最小贝叶斯风险编解码技术 (MBR) 来消除基于 beam search 算法的模型自信度导致的输出错误，并使用 GPU 批量计算贝叶斯风险值以加速解码，并在机器翻译中验证后期 MBR 解码的优越性。

Apr, 2017

基于质心的高效最小贝叶斯风险解码

采用基于质心的最小贝叶斯风险解码方法可提高解码速度，并在翻译质量上超过标准的最小贝叶斯风险解码方法。

Feb, 2024

关于最小贝叶斯风险解码真实分布逼近

使用异常检测来衡量最小贝叶斯风险解码的核心假设与性能之间的联系。

Mar, 2024

基于置信度剪枝的更快最小贝叶斯风险解码

在最小贝叶斯风险解码中，通过逐渐增加样本数来估计效用，并使用基于自助法的抽样获得的置信度估计来剪除不太可能具有最高效用的假设，从而在准确性方面与标准 MBR 无显著差异的情况下，需要较少的样本并大幅减少效用函数调用次数。

Nov, 2023

神经机器翻译中最小贝叶斯风险解码的特性理解

本论文探讨神经机器翻译中的偏差以及在域偏移和样本干扰下的弱点，并找到应用最小贝叶斯风险解码对抗这些问题的方案。结果表明，这个方法虽然仍有长度和频率偏差，但同样增加了模型的鲁棒性，对样本干扰和域偏移具有更好的适应能力

May, 2021

用基于采样的方法逼近最小贝叶斯风险解码在神经机器翻译中的应用

本研究分析了一种比 beam search 更有效的基于最小贝叶斯风险译码的决策规则，并设计了基于搜索和估计效用的成本分离近似算法，探讨了以模式为导向的策略对译文翻译的效果，实验证明这种方法在三种语言对中均能提高翻译质量。

Aug, 2021

揭示源的威力：基于源的最小贝叶斯风险解码用于神经机器翻译

本研究提出了一种基于源的 MBR 解码方法（sMBR），利用由后向翻译生成的合成源作为 “支持假设”，以及无参考质量估计度量作为效用函数，实现了仅利用源进行 MBR 解码的首次工作。实验证明，sMBR 明显优于 QE 重排并且与标准 MBR 解码相竞争。此外，与 MBR 相比，sMBR 较少调用效用函数的次数。结果表明，sMBR 是一种有潜力提高质量的 NMT 解码方法。

Jun, 2024