BriefGPT.xyz
Nov, 2020
探究神经机器翻译的连续训练期间的灾难性遗忘
Investigating Catastrophic Forgetting During Continual Training for Neural Machine Translation
HTML
PDF
Shuhao Gu, Yang Feng
TL;DR
在域自适应背景下,我们从模块和参数(神经元)的角度探究了神经机器翻译(NMT)模型的灾难性遗忘原因,发现一些模块与通用领域知识有紧密联系,而其他一些模块在域自适应中更为重要,一些参数对通用领域和领域内翻译都很重要,而在持续训练期间它们的大幅变化导致了通用领域性能下降。
Abstract
neural machine translation
(NMT) models usually suffer from
catastrophic forgetting
during
continual training
where the models tend to gra
→