AAAINov, 2019

通过操作多头注意力生成多样化翻译

TL;DR本文研究 Transform 模型在机器翻译中的应用,探讨其编码器 - 解码器多头注意力机制中,不同注意力头与翻译候选词的对应关系,提出一种操控头以生成多样化翻译的方法,并利用这些多样化翻译进行后向翻译以改进数据增强技术,并且不会严重降低翻译质量。实验结果表明,与这些多样化翻译的后向翻译可以显著提高翻译任务的性能,与之相关的对话响应生成任务的实验也验证了多样化的效果。