用于束搜索再排序的简单基准线

Dec, 2022

A Simple Baseline for Beam Search Reranking

PDF

Lior Vassertail, Omer Levy

TL;DR本文介绍了一种简单的方法，通过训练重新排序器来预测翻译候选的 BLEU 分数，从而达到准确衡量机器翻译质量的目的。在未引入其他数据或参数的情况下，此方法可以作为该领域未来研究的一个干净的基线模型。

Abstract

reranking methods in machine translation aim to close the gap between common evaluation metrics (e.g. bleu) and →

reranking methods machine translation bleu maximum likelihood learning monolingual corpora

发现论文，激发创造

基于能量的再排序：利用能量模型来提高神经机器翻译的效果

通过基于能量的重新排序算法，利用基于 MLE 的 NMT 生成更高 BLEU 分数的样本，实现了比 MLE 更好的性能。

Sep, 2020

自然语言生成的增量光束操作

本论文提出了增量束搜索方法，即在解码过程中重新排列束中的假设，以提高自然语言生成系统的性能，实验结果表明，该方法相对于传统束搜索方式，在 E2E 和 WebNLG 挑战测试集中分别使 BLEU 得分提高了 1.93 和 5.82 个百分点，在 E2E 挑战测试集上也比一种强大的再排序器表现更好。

Feb, 2021

超越束搜索的机器翻译解码

本文探讨是否可以将 Beam Search 替换为更强大的以度量为驱动的搜索技术。通过对多个解码算法的探索和分析，发现最佳算法取决于目标度量的特性；作者提出的基于 Monte-Carlo Tree Search (MCTS) 的搜索方法在语言应用中具有很高的应用价值，为今后的研究方向提供了新视角。

Apr, 2021

机器翻译中的正则化最小贝叶斯风险重新排序框架

该研究提出了一种基于 semantic-based similarity 和 truncating list 的在机器翻译中提高翻译质量的方法 Regularized MBR reranking framework (RMBR)。

Mar, 2022

神经机器翻译中更可信结果的更强基线

本文探讨了神经机器翻译中的基准问题，并提出了三种易于实现的方法，使得翻译结果得到了明显提高，同时通过对改进的分析也揭示了基本神经机器翻译模型所存在的固有缺陷。研究还指出，在实验中选择一个强基准线是获得可靠实验结果的关键因素之一。

Jun, 2017

基于神经度量的最小贝叶斯风险解码：高质量而非高模型概率

本篇论文研究神经机器翻译，提出使用最小贝叶斯风险解码优化翻译质量度量作为一种替代推论策略来优化自动翻译质量度量，实验结果表明，使用 BLEURT 作为质量度量指标产生的质量比传统 Beam-search 输出更好。

Nov, 2021

突破束缚搜索：关于神经机器翻译评分方法和停止准则的研究

本文提出了几种方法解决 beam search 的扩展导致的机器翻译质量下降的问题，讨论了这些方法的最优停止准则，并展示了无超参数方法在中英翻译中的优异表现，超过了使用长度规范化启发式方法的 BLEU 值 2.0，并在所有方法中获得了最佳结果。

Aug, 2018

超越 BLEU：利用语义相似性训练神经机器翻译

本文提出了一种基于语义相似度的代替奖励函数来优化 NMT 系统，在四种不同的语言翻译成英语的情况下，本文的方法不仅能提高 BLEU 和语义相似度的评估准确性，而且优化过程更快。

Sep, 2019

BERTTune: 使用 BERTScore 微调神经机器翻译

本文提出使用基于 BERTScore 评估指标的新型训练目标对神经机器翻译模型进行微调，以克服在训练过程中出现的过拟合偏见问题；作者提出三种生成软预测的方法，可使网络保持端到端的完全可微性，实验表明在四种不同的语言对上，微调目前具有一个强基线模型的 BLEU 分数提高了 0.58pp（3.28%），BERTScore 得分提高了 0.76pp（0.98%）。

Jun, 2021

跨语言信息检索的简洁有效神经排序和重排序基线

该研究旨在提供一种用于跨语言检索模型的组织框架，并在 TREC 2022 NeuCLIR 中的三种语言测试集上实现基于此的可重复现的基准线。

Apr, 2023