BriefGPT.xyz
Ask
alpha
关键词
gumbel-softmax gates
搜索结果 - 1
EMNLP
改进和解释预训练语言模型的语言专家混合适配器
本研究提出了一种方法,在参数高效微调(PEFT)环境中将语言结构注入到预训练语言模型中。我们使用一种新颖的语言专家混合体架构,将编码不同语言结构的并行适配器模块进行组合,并使用 Gumbel-Softmax 门来确定模型每一层中这些模块的重
→
PDF
8 months ago
Prev
Next