Oct, 2024

小型语言模型如同小词汇:探究基于音素和字素的幼小拉马的语言能力

TL;DR本研究针对当前语言模型中使用子词级标记算法的局限性展开,提出无标记的音素和字素基语言模型的新方法。研究表明,基于字符级词汇的小型Llama架构模型在标准句法和新的词汇/语音基准测试中表现出色,且音素模型在不受字素偏见影响的情况下几乎与字素模型持平。这些发现为创造更具语言合理性的语言模型提供了有希望的方向,尤其适用于语言习得与处理的计算研究。