BriefGPT.xyz
Ask
alpha
关键词
byte-level models
搜索结果 - 2
MambaByte: 无需令牌的选择性状态空间模型
基于字节的 MambaByte 模型是一种无需标记的语言模型,它在计算效率方面表现出色,优于其他基于字节的模型,并且可以超过现有的基于子词的模型,因此可用于无需标记的语言建模。
PDF
5 months ago
ACL
ByT5: 面向预训练字节到字节模型的无令牌未来
本文研究了基于字节级别文本的 Transformer 架构,相比于基于词或子词的标准模型,该模型可处理任何语言的文本,更加稳健且精度更高,并开源了基于 T5 架构的预训练模型及所有实验所用代码和数据。
PDF
3 years ago
Prev
Next