面向鲁棒的 k 近邻机器翻译

Oct, 2022

Towards Robust k-Nearest-Neighbor Machine Translation

Hui Jiang, Ziyao Lu, Fandong Meng, Chulun Zhou, Jie Zhou...

TL;DR本文研究并发现kNN-MT的性能下降问题，提出了一种信心增强的kNN-MT模型，结合鲁棒训练和两种扰动方式以达到在基准数据集上实现显着改进和更好的鲁棒性的效果。

Abstract

k-nearest-neighbor machine translation (kNN-MT) becomes an important research direction of nmt in recent years. Its main idea is to retrieve useful key-value pairs from an additional datastore to modify translati

发现论文，激发创造

通过数据增强提高神经机器翻译的鲁棒性：超越回译

本文探讨了神经机器翻译以及如何提高其对于噪声输入的鲁棒性，提出了新的数据扩充方法以及通过利用外部数据中的噪声来加强模型鲁棒性。

Oct, 2019

最近邻机器翻译

本研究提出$k$-最近邻机器翻译方法，基于神经翻译模型的表示进行相似性搜索，不需要额外训练，适用于广泛的场景，并且可以通过使用特定于域的数据存储库来适应不同的领域，显著提高翻译性能。

Oct, 2020

自适应最近邻机器翻译

本研究提出了一种新的kNN-MT方法，使用轻量级的元k网络动态确定每个目标令牌的k值，该方法能够有效过滤检索结果中的噪声并显著优于传统的kNN-MT模型，在四个基准机器翻译数据集上得到了验证，并在其他领域展现了其普适性。

May, 2021

基于聚类的高效k近邻机器翻译

本文提出了一种用于领域自适应的非参数翻译解决方案“k最近邻机器翻译（kNN-MT）”，并通过在聚类的基础上通过对比学习的方式构建紧凑网络，提高了检索效率并且在大型数据集上取得了更好或相当的性能表现，同时对于不同领域的通用性很强。

Apr, 2022

神经机器翻译最近邻知识蒸馏

本文提出一种改进机器翻译模型的方法，即将 NN search 前置，并通过最近邻知识蒸馏（NN-KD）训练基本 NMT 模型直接学习NN知识，可以更好地解决机器翻译中的过度纠正问题，并在保持训练和解码速度不变的情况下，实现了比NN-MT等现有方法更好的结果。

May, 2022

简单且可扩展的最邻近机器翻译

本文提出了一种基于句子级检索的最近邻机器翻译框架，用于快速领域自适应，该框架旨在大大提高 kNN-MT 模型的解码和存储效率，并且不会影响翻译性能。实验证明，该框架不仅能够达到与 NMT 模型相同的速度，且能够显著减少存储要求。

Feb, 2023

最近邻机器翻译是输出投影层上的元优化器

本文分析了$k$NN-MT的理论和实证研究，以及针对多域实验和单词级别的分析，发现在特定情况下，结合$k$NN-MT和适配器的方法能够实现与在域测试集上微调相当的翻译性能，并在域外测试集上取得更好的性能,同时，优化上下文表示可以弥补低频特定领域词汇召回方面$k$NN-MT与微调的差距。

May, 2023

knn-seq: 高效，可扩展的kNN-MT框架

k-nearest-neighbor machine translation improves neural machine translation by utilizing a vector database of translation examples, and the paper presents an efficient framework called knn-seq to handle large datasets.

Oct, 2023

用扰动的kNN-MT生成多样化的翻译

通过引入扰动k最近邻机器翻译（kNN-MT）方法，本文提出了一种生成更多样化翻译的方法，解决了过校正问题，改善了候选翻译的多样性，并通过调整扰动的幅度来控制多样性程度。

Feb, 2024

高效的动态检索k近邻机器翻译

非参数NMT领域自适应研究中，提出了基于k最近邻机器翻译的动态检索方法，通过线性插值系数lambda调整质量分布预测，同时引入基于多层感知机的分类器以及动态生成阈值的方法，从而提高模型的效率和适应性。

Jun, 2024