BriefGPT.xyz
大模型
Ask
alpha
关键词
long convolution sequence models
搜索结果 - 1
豪笑鬣狗酿酒厂:从卷积中提取紧凑的重现
通过提取低维线性状态空间模型以及改进卷积层的结构,本文实现了每个标记的 O (1) 计算和内存开销,从而降低内存占用并提高生成过程的吞吐量,而无需牺牲质量。
PDF
8 months ago
Prev
Next