BriefGPT.xyz
大模型
Ask
alpha
关键词
joint training process
搜索结果 - 1
ACL
预训练语言模型中新兴的跨语言结构
通过研究多语言掩码语言建模问题,我们阐述了若干因素,即为何这些模型在跨语言转移方面如此有效,并证明了即使单语料库之间没有共享词汇,也可以进行转移,只需在多语言编码器顶层存在一些共享参数。同时,我们展示了来自不同语言、独立训练模型的表示可以很
→
PDF
5 years ago
Prev
Next