BriefGPT.xyz
大模型
Ask
alpha
关键词
pre-training mechanism
搜索结果 - 3
重新设置并忘记它:重新学习最后一层的权重提高持续和迁移学习
通过实验验证,本文发现通过反复重置最后一层的权重(即 “zapping”)的简单预训练机制可以提高迁移学习和持续学习的性能,这一机制在许多领域都适用,并且在计算上高效简单。
PDF
9 months ago
UPRec: 面向用户的推荐系统预训练
本文提出了一种名为 UPRec 的方法,通过构建自监督任务来利用用户属性和结构化社交图形,并将用户信息整合到预训练模型中,为用户提供更合适的推荐。
PDF
3 years ago
神经机器翻译中的组合性
本研究探讨了神经机器翻译中组合性的两个具体表现:生产力和系统性,并通过一种简单的预训练机制减轻了编码器的表示不足而显著提高了 BLEU 分数。
PDF
5 years ago
Prev
Next