Jul, 2023

MorphPiece:远离统计语言表示

TL;DR本研究提出了一种基于形态分词的语言学分词方案 MorphPiece,并使用此方法训练了一个基于 GPT 的语言模型 MorphGPT。相对于标准的 BPE 分词器,MorphGPT 具有更好的性能表现,包括在超大语言模型性能及 NLP 任务上表现出更高水平。