Aug, 2019

利用胶囊网络改进多头注意力

TL;DR本文利用胶囊网络对多头注意力中缺乏的不同子空间之间的语义重叠问题进行优化,通过采用动态路由和期望最大化算法进行信息聚类和分离,从而对汉英翻译和英德翻译任务的 Transformer 模型进行改进。