BriefGPT.xyz
大模型
Ask
alpha
关键词
language-specific neurons
搜索结果 - 3
ACL
基于解码器的预训练语言模型的多语言能力:发现和控制语言特定神经元
当前基于解码器的预训练语言模型(PLMs)成功展示了多语言能力,但这些模型如何处理多语言仍不清楚。我们分析了多语言解码器 PLMs 的神经元级内部行为,特别是考察解码器 - 仅多语言 PLMs 内部是否存在 “独特地只为每种语言” 激活的神
→
PDF
3 months ago
大型语言模型如何处理多语种能力?
大型语言模型在跨多种语言表现出卓越的性能。本文探讨了大型语言模型处理多语言的方式,提出了一个处理多语言输入的框架,并利用该框架验证其有效性,并展示如何通过该框架有效提升多语言能力。
PDF
4 months ago
语言特定神经元:大型语言模型多语能力的关键
通过新的检测方法 - 语言激活概率熵(LAPE),我们研究了大型语言模型中的 Transformer 架构,以确定语言特定的区域,并显示了激活或关闭特定语言神经元对大型语言模型输出语言的可控性。
PDF
4 months ago
Prev
Next