Aug, 2022

基于 GPU 的聚类快速词汇投影法用于多语机器翻译

TL;DR本文提出了一种通过聚类实现快速词汇投影的方法,以用于 GPU 上的多语言 transformers,结果显示在保持 BLEU 得分的同时,在浮点 GPU 推理速度上最高可提高 25%,并最高可提高 2.6 倍的词汇投影速度。