Feb, 2023

用贪心的方式对层权重矩阵进行排序,提高 Transformer 的翻译效果

TL;DR利用 AEIUOrder 算法通过改变编码器权重矩阵的顺序来最大化总的训练程度,从而提高 Transformer-based encoder-decoder 模型的翻译质量。