Jul, 2024

状态空间模型在机器翻译中的有效性如何?

TL;DR通过严格细致的实验比较,本文发现Mamba与transformers在句子和段落级数据集上具有相当的竞争力,并且将注意力机制集成到Mamba中可以提高翻译质量、对序列长度外推的鲁棒性和对命名实体的记忆能力。