Aug, 2020
自监督视听表示学习的协同关注网络
Look, Listen, and Attend: Co-Attention Network for Self-Supervised
Audio-Visual Representation Learning
TL;DR本文提出了一种基于自我监督和共注意力机制的框架,通过区分具有关联性的视觉和声音信息,提出了三种不同的共注意力模块以训练神经网络,并通过测试了解了该方法的广泛和可转移性,成功地在先前的任务中取得了最先进的结果,解决了多声源场景的问题。