BriefGPT.xyz
Ask
alpha
关键词
transformer representations
搜索结果 - 2
ACL
面向资源匮乏情况下内容标记的邻域框架
我们提出了一种使用有限的目标语言数据进行跨语言内容标记的新框架,采用最近邻居结构,在所有组件中使用 Transformer 表示法,可适应新的源语言实例,提出两种编码方案并在滥用语言检测方面实现了显著的改进。
PDF
3 years ago
重新思考预训练语言模型中的嵌入耦合
重新评估了先进的预训练语言模型中共享输入和输出嵌入权重的标准做法,表明解耦的嵌入提供了更好的建模灵活性,允许我们在多语言模型的输入嵌入的参数分配方面显着提高参数分配效率。通过在 Transformer 层中重新分配输入嵌入参数,我们在保持微
→
PDF
4 years ago
Prev
Next