Jan, 2024

MambaByte: 无需令牌的选择性状态空间模型

TL;DR基于字节的 MambaByte 模型是一种无需标记的语言模型,它在计算效率方面表现出色,优于其他基于字节的模型,并且可以超过现有的基于子词的模型,因此可用于无需标记的语言建模。