ACLMay, 2018

Seq2Seq-Attention 模型中语言泛化和失败之间的微妙平衡

TL;DR研究表明 Seq2Seq 模型在一些特殊结构外的数据上表现可能不理想,而本文探讨了在一个简单的、明确定义的结构转换任务中,该模型实现泛化的能力如何取决于其随机种子的选择且其泛化结构的能力高度敏感。