Nov, 2021

视频中响物定位的时空记忆网络

TL;DR提出了一种利用时间同步和关联的声音和视觉信息的网络,用于视频中声音对象的本地化