Feb, 2023

二值化神经机器翻译

TL;DR本文提出了一种新的二值化技术,基于一位权重和激活函数的 Transformer 应用于机器翻译,实验证明其可以达到与浮点型 Transformer 相同的质量,同时大小只有其 16 倍,并通过额外的 LayerNorms 和残差连接改进了二值化的质量。此外,作者在生产规模的翻译数据集上进行了一项标尺研究,表明一位权重 Transformer 在域内和域外环境下均具有可扩展性和良好的泛化效果。