BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-lingual tasks
搜索结果 - 3
PaLM: 基于路径的语言建模规模化
通过使用 Pathways ML 系统训练 PaLM,我们证明了模型规模对少样本学习的影响,PaLM 540B 在大量语言理解、生成基准测试中取得了突破性表现,并在多步推理任务中超越了微调表现,另外还有强大的多语种任务和源代码生成能力,以及
→
PDF
2 years ago
ACL
Transformer 注意力头在多语言和跨语言任务中的贡献
该论文研究了注意力头在 Transformer 模型中的相对重要性,以帮助其在跨语言和多语言任务中的可解释性。通过大量实验,证明了在多语言 Transformer 模型中修剪注意力头可以在跨语言和多语言任务中提高模型性能,并且可以使用梯度对
→
PDF
3 years ago
ACL
有效多任务和多语言建模的元学习
通过元学习方法,将任务和语言相互作用的表征共享,可提高自然语言处理任务和多语种任务性能。
PDF
3 years ago
Prev
Next