Nov, 2024

LBPE:优先处理长令牌的分词方法以改善大型语言模型

TL;DR本研究解决了大型语言模型中长令牌频次不足导致学习不平衡的问题。提出的LBPE方法在编码过程中优先考虑长令牌,从而平衡短令牌和长令牌之间的频率差异。实验结果表明,LBPE在多种语言建模任务中表现优于传统的字节对编码(BPE),展示了其有效性。