Aug, 2020

通过联合注意力的递归融合实现音视频事件定位

TL;DR本研究提出了一种新的多模态融合联合注意力机制,能够有效地从视听特征中学习联合表示,并通过递归式联合协同作用持续改进,从而在音视频事件定位任务中取得了明显的成果。