Sep, 2023

TMac: 音频事件分类的时间多模态图学习

TL;DR我们提出了一种基于时态多模态图学习技术的音频事件分类方法TMac,通过建模这种时态信息,我们构建了每个音频事件的时态图,通过利用图学习技术来捕捉模态内部和模态间的动态信息,实现了优于其他最先进模型的性能。