Aug, 2023

快速训练带有数据排序的 NMT 模型

TL;DR提出了一种基于长度排序的算法,用于降低 Transformer 模型计算空标记的计算负担,以提高机器翻译的计算速度和性能。