EMNLPSep, 2018

立方体修剪加速神经机器翻译解码

TL;DR本文利用立方剪枝技术,构建目标语言等价类和减少 RNN 展开所需并行操作和 softmax 运算,以提高神经机器翻译的翻译速度,同时保证翻译质量,在 GPU 上快了约 3.3 倍,在 CPU 上快了约 3.5 倍。