BriefGPT.xyz
Ask
alpha
关键词
decoder-only transformer architectures
搜索结果 - 1
基于锚定的大型语言模型
本研究引入了基于锚点的 LLM (AnLLM) 模型,该模型利用了一种创新的基于锚点的自注意力网络 (AnSAN) 和一种基于锚点的推理策略,将序列信息压缩到锚点令牌中,从而减少键 / 值缓存并提高推理效率。实验证明,AnLLM 在保持可比
→
PDF
5 months ago
Prev
Next