BriefGPT.xyz
大模型
Ask
alpha
关键词
modular deep learning
搜索结果 - 3
无训练即获益:用于无需训练的语言适配器增强的语言算术
在多语言预训练语言模型中,模块化深度学习是解决多语言性的技术,而语言算术是一种训练后的后处理方法,能够显著提升在零样本和低资源应用中的多语言性能。
PDF
2 months ago
COLING
模块性是否可转移?通过知识蒸馏的案例研究
模块化深度学习在自然语言处理应用中展现了潜力,而参数高效微调(PEFT)模块化已经表明其适用于各种情况,从领域自适应到多语言设置。本文通过知识蒸馏的视角填补了现有模块化方法的一个重要空白,并提出了一种非常简单的方法,在同一家族的预训练语言模
→
PDF
3 months ago
跨语言 NLU 中的语言适配器的影响
在不存在语言的监督数据的情况下,本文研究了语言适配器在自然语言理解任务中零样本跨语言转移中的作用,通过对两个多语言模型和三个多语言数据集的详尽消融研究,结果表明目标语言适配器在任务、语言和模型间影响高度不一致。相比之下,保留源语言适配器通常
→
PDF
5 months ago
Prev
Next