ACLApr, 2024

F-MALLOC: 神经机器翻译中的前馈式记忆分配连续学习

TL;DR在神经机器翻译中,前预训练再微调模式取得了令人印象深刻的结果,但灾难性遗忘仍然是一个挑战。为了解决这个问题,我们提出了一种连续学习方法,名为 F-MALLOC (前馈记忆分配),通过将前馈层分解为离散的记忆单元并将这些记忆分配给不同的任务,从而有效缓解了灾难性遗忘并确保了系统的可扩展性。此外,我们还提出了一个多阶段连续学习评估协议。根据这个新协议进行的实验显示了 F-MALLOC 的出色性能,体现在较高的 BLEU 得分和几乎没有遗忘。