BriefGPT.xyz
Ask
alpha
关键词
contrastive weight tying
搜索结果 - 1
无头语言模型:基于对比加权连接的无预测学习
自监督预训练语言模型通常通过对广泛的词汇表进行概率分布预测。在本研究中,我们提出了一种创新的方法,通过对比权重绑定(CWT)以对比的方式重构输入嵌入,从而摆脱了概率预测。我们将该方法应用于单语和多语境下预训练无头语言模型。我们的方法在减少训
→
PDF
10 months ago
Prev
Next