Jun, 2017

深度可分离卷积在神经机器翻译中的应用

TL;DR本研究探讨如何将深度可分离卷积应用于神经机器翻译任务。我们提出了一种新的基于 Xception 和 ByteNet 的架构 SliceNet,并发现深度可分离卷积能够在减少参数数量和计算量的同时获得与 ByteNet 相似的性能,同时展示了深度可分离卷积对于神经机器翻译任务的性能表现以及其带来的架构变化。