BriefGPT.xyz
大模型
Ask
alpha
关键词
decoder-based pre-trained language models
搜索结果 - 1
ACL
基于解码器的预训练语言模型的多语言能力:发现和控制语言特定神经元
当前基于解码器的预训练语言模型(PLMs)成功展示了多语言能力,但这些模型如何处理多语言仍不清楚。我们分析了多语言解码器 PLMs 的神经元级内部行为,特别是考察解码器 - 仅多语言 PLMs 内部是否存在 “独特地只为每种语言” 激活的神
→
PDF
3 months ago
Prev
Next