May, 2023

探究子词分割对 Transformer 语言模型性能的影响

TL;DR本文研究了形态素如何影响语言模型的性能,通过使用 StateMorph 对芬兰语和俄语进行训练,发现相比于 BPE 和 Morfessor,使用 StateMorph 能够使模型更高效地收敛并获得更好的验证分数。