Dec, 2023

TCNCA: 多段关注的时间卷积网络用于可伸缩的序列处理

TL;DRTCNCA 是一种具有切分关注力的时间卷积网络,通过用一种特殊的时间卷积网络替换线性递归操作,在减少计算复杂度的同时提供更大的感受野大小和更浅的网络结构。在多个任务中,TCNCA 表现优于 MEGA,并在处理非常长的序列长度时具有可扩展性。