Jul, 2022

加权多聚合器图同构网络用于语音情感识别

TL;DR本文提出一种基于图同构网络的语音情感识别(SER)网络,采用带权重的多聚合器(WMA-GIN)、全邻接层(FA)、多阶段注意机制和多损失训练策略,以解决 GIN 结构的邻居节点特征聚合容易导致的信息混淆、以及所有 GIN 等图神经网络结构的过度压缩问题,实现了比其它基于图神经网络和某些非图神经网络方法更好的结果,在 IEMOCAP 数据集中取得了 72.48% 和 67.72% 的加权和不加权识别精度。