Nov, 2020

探究神经机器翻译的连续训练期间的灾难性遗忘

TL;DR在域自适应背景下,我们从模块和参数(神经元)的角度探究了神经机器翻译(NMT)模型的灾难性遗忘原因,发现一些模块与通用领域知识有紧密联系,而其他一些模块在域自适应中更为重要,一些参数对通用领域和领域内翻译都很重要,而在持续训练期间它们的大幅变化导致了通用领域性能下降。