Feb, 2020

基于时间卷积关注的序列模型网络

TL;DR我们提出了一种基于时间卷积网络和注意力机制的探索性架构称为 TCAN,它不仅能够实现递归网络的近似替代,还可以吸收前向模型的优势,提高了 word-level PTB、character-level PTB 和 WikiText-2 等文本数据集的 bpc/perplexity 表现.