May, 2024

IGOT:针对域自适应预训练的信息增益优化分词器

TL;DR使用信息增益优化的分词器 (IGOT) 在特定领域下进行持续预训练可提高训练效率与性能,降低收敛半径与收敛点。