Nov, 2019

DEEP FACTORIZED INPUT TOKEN EMBEDDINGS FOR NEURAL SEQUENCE MODELING

TL;DRDeFINE是一种采用分层结构和跳跃连接的新方法,用于有效地学习深度token表示,可以在新的或现有的序列模型中轻松集成,相较于现有方法在保持性能的同时可将Transformer-XL的总参数降低一半,AWD-LSTM的参数减少17%并提高4个点的性能。