Jul, 2023

利用内存增强适配器的可插拔神经机器翻译模型

TL;DR本研究提出了一种记忆增强适配器模型,利用用户提供的样本控制预训练神经机器翻译模型的生成行为,减少针对不同用户需求独立训练的成本和数据稀缺性挑战,其训练策略可以有效地降低模型与记忆之间的虚假依赖,并在实验中表现出优异的效果。