May, 2023

非参数最近邻辅助微调神经机器翻译

TL;DR研究探究了在微调阶段引入kNN预测的统计数据来提高基线翻译模型,发现通过引入gating机制,kNN的真实概率和强化学习三种方法,相比于传统的微调,可以在四个标准机器翻译数据集上实现一致的改进,尤其于翻译语法关系或功能词时表现出更大的提升。