BriefGPT.xyz
大模型
Ask
alpha
关键词
f-malloc
搜索结果 - 1
ACL
F-MALLOC: 神经机器翻译中的前馈式记忆分配连续学习
在神经机器翻译中,前预训练再微调模式取得了令人印象深刻的结果,但灾难性遗忘仍然是一个挑战。为了解决这个问题,我们提出了一种连续学习方法,名为 F-MALLOC (前馈记忆分配),通过将前馈层分解为离散的记忆单元并将这些记忆分配给不同的任务,
→
PDF
3 months ago
Prev
Next