BriefGPT.xyz
Ask
alpha
关键词
sounding object localization
搜索结果 - 2
CVPR
用于混音声源定位的音视频分组网络
本文提出了一种 AVGN 网络,通过可学习的音频 - 视觉类别权重直接学习每个音频源的语义特征,可以同时定位多个音频源,达到了先进的音响目标定位效果。
PDF
a year ago
视频中响物定位的时空记忆网络
提出了一种利用时间同步和关联的声音和视觉信息的网络,用于视频中声音对象的本地化
PDF
3 years ago
Prev
Next