Dec, 2023
TCNCA: 多段关注的时间卷积网络用于可伸缩的序列处理
TCNCA: Temporal Convolution Network with Chunked Attention for Scalable Sequence Processing
Aleksandar Terzic, Michael Hersche, Geethan Karunaratne, Luca Benini, Abu Sebastian...
TL;DRTCNCA 是一种具有切分关注力的时间卷积网络,通过用一种特殊的时间卷积网络替换线性递归操作,在减少计算复杂度的同时提供更大的感受野大小和更浅的网络结构。在多个任务中,TCNCA 表现优于 MEGA,并在处理非常长的序列长度时具有可扩展性。