BriefGPT.xyz
大模型
Ask
alpha
关键词
subword-based tokenization
搜索结果 - 1
ACL
WECHSEL: 用于对单语言模型进行跨语言转移的子词嵌入有效初始化
本论文介绍了一种称为 WECHSEL 的新型方法,它可以在不同语言之间高效地转移预训练语言模型,通过使用基于子词的标记化和多语言静态词嵌入,WECHSEL 可以解决传统方法中在训练新语言时昂贵和耗时的问题,同时提高了跨语言参数传递的效果和可
→
PDF
3 years ago
Prev
Next