Jun, 2024

变压器工作记忆中符号表示的复杂性与任务复杂性的相关性

TL;DR这篇论文研究了在 Transformer 模型解码器中添加的符号工作内存的属性,该工作内存增强了机器翻译任务中模型预测的质量,并作为信息的神经符号表示,对于模型进行正确翻译至关重要。通过研究记忆内容发现,翻译文本的关键词存储在工作内存中,指向记忆内容与处理文本的相关性。此外,存储在内存中的标记和词性的多样性与机器翻译任务的复杂性相关。