Dec, 2023

NAC-TCN: 基于因果稀疏邻域注意力的时序卷积网络用于情感理解

TL;DR视频情感识别是通过一系列方法如 GRUs、LSTMs、自注意力机制、Transformers 和 TCNs 改善了基于视频情感识别,然而这些方法存在内存使用高、操作量大或梯度下降不良的问题。我们提出了一种称为邻域注意力与卷积 TCN(NAC-TCN)的方法,它结合了注意力和时序卷积网络的优点,并确保理解因果关系,从而减少计算和内存成本。我们的模型在标准的情感识别数据集上比 TCNs、TCAN、LSTMs 和 GRUs 取得了相当好或最先进的性能,并且需要较少的参数。我们在线发布了我们的代码,以便其他项目能够轻松复现和使用。