神经机器翻译能否通过用户反馈进行改进？

ACLApr, 2018

神经机器翻译能否通过用户反馈进行改进？

Can Neural Machine Translation be Improved with User Feedback?

Julia Kreutzer, Shahram Khadivi, Evgeny Matusov, Stefan Riezler

TL;DR本研究在 ebay 电商平台上，使用了人类增强的方法来改进神经机器翻译 (NMT)，并通过通过跨语言搜索任务收集的隐式任务反馈，提高了翻译质量和任务效率。

Abstract

We present the first real-world application of methods for improving neural machine translation (NMT) with human reinforcement, based on explicit and implicit user feedback collected on the →

neural machine translation human reinforcement feedback ebay cross-lingual search

发现论文，激发创造

神经机器翻译的非参数人类反馈在线学习

本研究提出一种新颖的非参数在线学习方法，该方法引入了两个 k 最近邻模块，一个模块记忆人工反馈，另一个模块自适应地平衡历史人工反馈和原始 NMT 模型，实验结果表明，在 EMEA 和 JRC-Acquis 基准测试中，该方法在翻译准确性上得到了实质性的改进，并实现了更好的适应性能，需要更少的重复人工纠正操作。

Sep, 2021

基于强化学习的神经机器翻译波段信道模型仿真人反馈

本文提出了一种使用虚拟的人类反馈数据，通过强化学习算法，结合基于注意力机制的神经编码解码架构，优化神经机器翻译系统的方法。该算法适用于大动作空间和延迟回报的问题，并能有效优化传统机器翻译测量指标。

Jul, 2017

神经机器翻译中基于块反馈的学习

本文实证研究了神经机器翻译中的部分反馈学习，提出了一种使用用户反馈信息的简单有效的方法，并证明了基于块级别的用户反馈信息可以降低训练和部署之间的领域不匹配问题，模拟实验表明块级别反馈相较于句子级反馈，能提高 2.61% 的 BLEU 绝对值。

Jun, 2018

机器之间的机器翻译：情感分类应用案例

提出了一种神经机器翻译的方法，利用一种新的候选采样策略，基于强化学习技术提高翻译模型的机器导向性，从而产生最适合用作特定下游任务的自然语言处理组件输入的翻译结果，这种方法可以显著提高英文分类器对 Twitter 数据的情感分类的性能。

Oct, 2019

面向用户驱动的神经机器翻译

本文介绍了一种基于用户驱动的神经机器翻译系统，该系统能够捕捉用户的历史输入并生成个性化的翻译结果。为了填补当前缺乏用户行为注释平行数据集和难以对零样本情况的用户画像建模的差距，提出了一种基于缓存和对比学习方法的框架。同时，作者还贡献了第一个中英平行语料库 UDT-Corpus。实验结果表明，该系统能够生成用户特定的翻译结果。

Jun, 2021

基于强化和模仿的交互式预测神经机器翻译

通过交互式预测神经机器翻译框架进行模型个性化，并借助强化学习和模仿学习的方法。在交互式的过程中，用户可以反馈不确定区域的翻译结果，并能提交编辑建议，我们通过集成这些反馈，使用约束束搜索，对模型进行调整迭代，实验结果表明，相对于传统监督模型，该模型更易于个性化，并且具有相近的翻译性能

Jul, 2019

面向专业人员的 NMT 增量调整：用户研究

本文研究使用在线学习方法对神经网络机器翻译系统进行改进，通过用户实验表明改进后的系统在翻译质量、减少人工修改时间等方面有了明显的提升。

Jun, 2019

一种交互式预测神经机器翻译的强化学习方法

该研究提出了一种交互式预测神经机器翻译的方法，通过人类质量判断和基于熵的不确定性准则来降低人力需求以及实现在线模型参数的更新，模拟实验表明这种方法可以显著提高翻译质量并将人力需求控制在一个较低的水平。

May, 2018

人类赌徒反馈在序列到序列强化学习中的可靠性和可学习性

探索了来自人的 bandit 反馈对强化学习的影响，用神经机器翻译作为样例。研究表明标准化的评级反馈是最可靠的，且可以通过训练出的回归模型进行序列学习从而更好地进行强化学习。

May, 2018

Booking.com 实例：朝着全面推广的神经机器翻译

本文介绍了在大规模电子商务环境中，构建一个内部旅游领域的神经机器翻译系统，并对其进行优化、训练（包括不同的优化策略和语料库规模）、处理现实世界内容以及评估结果等三个主题进行了研究。

Sep, 2017