BriefGPT.xyz
Ask
alpha
关键词
multilingual activation patterns
搜索结果 - 1
解密巴别塔:探索大型语言模型中的多语言激活模式
通过将大型语言模型(LLMs)转换为专家混合(MoE)架构,分析其在处理各种语言时的专家激活模式,探索并发现非语言特定神经元和语言特定激活神经元的存在,并展示了仅利用高频激活神经元可以在保持相当性能的同时加速推理的可能性,这些发现为 LLM
→
PDF
4 months ago
Prev
Next