Nov, 2018

多源 Transformer 解码器输入组合策略

TL;DR本研究针对 Transformer 架构的编码器 - 解码器注意力机制,提出了四种不同的输入组合策略 (serial, parallel, flat, and hierarchical) 用于多源多模态翻译和具有多个源语言的翻译任务,结果表明模型能够使用多个源,并且比单个源模型有显著提高。