BriefGPT.xyz
大模型
Ask
alpha
关键词
neuron specialization
搜索结果 - 2
神经元专业化:利用内在任务模块化实现多语言机器翻译
通过神经元特化,提出一种解决多语言翻译中干扰和促进知识转移的方法,并通过大量实验证明了其相比强基准模型的性能提升以及减少干扰并增加知识转移的效果。
PDF
3 months ago
ACL
预训练 Transformer 中的紧密联系模块化
本文研究使用预训练的 Transformers 中是否存在模块化,发现神经元具有功能专业化,可以通过 Mixture-of-Experts 将分组神经元分配到对应功能模块中。在预训练阶段,模块化结构会更快地稳定,文献代码和数据可在链接中获得
→
PDF
a year ago
Prev
Next