神经机器翻译能否通过用户反馈进行改进?
本研究提出一种新颖的非参数在线学习方法,该方法引入了两个 k 最近邻模块,一个模块记忆人工反馈,另一个模块自适应地平衡历史人工反馈和原始 NMT 模型,实验结果表明,在 EMEA 和 JRC-Acquis 基准测试中,该方法在翻译准确性上得到了实质性的改进,并实现了更好的适应性能,需要更少的重复人工纠正操作。
Sep, 2021
本文提出了一种使用虚拟的人类反馈数据,通过强化学习算法,结合基于注意力机制的神经编码解码架构,优化神经机器翻译系统的方法。该算法适用于大动作空间和延迟回报的问题,并能有效优化传统机器翻译测量指标。
Jul, 2017
本文实证研究了神经机器翻译中的部分反馈学习,提出了一种使用用户反馈信息的简单有效的方法,并证明了基于块级别的用户反馈信息可以降低训练和部署之间的领域不匹配问题,模拟实验表明块级别反馈相较于句子级反馈,能提高 2.61% 的 BLEU 绝对值。
Jun, 2018
提出了一种神经机器翻译的方法,利用一种新的候选采样策略,基于强化学习技术提高翻译模型的机器导向性,从而产生最适合用作特定下游任务的自然语言处理组件输入的翻译结果,这种方法可以显著提高英文分类器对 Twitter 数据的情感分类的性能。
Oct, 2019
本文介绍了一种基于用户驱动的神经机器翻译系统,该系统能够捕捉用户的历史输入并生成个性化的翻译结果。为了填补当前缺乏用户行为注释平行数据集和难以对零样本情况的用户画像建模的差距,提出了一种基于缓存和对比学习方法的框架。同时,作者还贡献了第一个中英平行语料库 UDT-Corpus。实验结果表明,该系统能够生成用户特定的翻译结果。
Jun, 2021
通过交互式预测神经机器翻译框架进行模型个性化,并借助强化学习和模仿学习的方法。在交互式的过程中,用户可以反馈不确定区域的翻译结果,并能提交编辑建议,我们通过集成这些反馈,使用约束束搜索,对模型进行调整迭代,实验结果表明,相对于传统监督模型,该模型更易于个性化,并且具有相近的翻译性能
Jul, 2019
该研究提出了一种交互式预测神经机器翻译的方法,通过人类质量判断和基于熵的不确定性准则来降低人力需求以及实现在线模型参数的更新,模拟实验表明这种方法可以显著提高翻译质量并将人力需求控制在一个较低的水平。
May, 2018
探索了来自人的 bandit 反馈对强化学习的影响,用神经机器翻译作为样例。研究表明标准化的评级反馈是最可靠的,且可以通过训练出的回归模型进行序列学习从而更好地进行强化学习。
May, 2018
本文介绍了在大规模电子商务环境中,构建一个内部旅游领域的神经机器翻译系统,并对其进行优化、训练(包括不同的优化策略和语料库规模)、处理现实世界内容以及评估结果等三个主题进行了研究。
Sep, 2017