BriefGPT.xyz
Ask
alpha
关键词
forgetting problem
搜索结果 - 2
MM
UER: 在线持续学习的启发式偏差解决方法
在线连续学习通过对连续数据流进行单次遍历来不断训练神经网络。通过将点积 logit 分解为角因子和模因子,我们发现偏差问题主要出现在角因子中,并利用模因子来平衡新旧知识以解决偏差问题。在三个数据集上的实验证明,解决偏差问题的启发式方法 UE
→
PDF
10 months ago
CBEAF-Adapting: 增强型持续预训练用于构建中文生物医学语言模型
本论文介绍了一种连续预训练方法,称为 CBEAF-Adapting,它的主要思想是在每个自注意力层和前馈网络中引入少量注意头和隐藏单元,有效地解决了领域适应中序列任务训练造成的遗忘问题,以中国生物医学领域为例进行了实验,结果表明我们的方法能
→
PDF
2 years ago
Prev
Next