BriefGPT.xyz
Ask
alpha
关键词
object guided localization
搜索结果 - 1
简单实现的视觉声音定位
本文提出了一种名为 EZ-VSL 的简单而有效的无监督音频 - 视觉源定位方法,旨在识别视频中的可见声源,其采用对齐音频和视觉空间的方法来实现,在 Flickr SoundNet 和 VGG-Sound Source 数据集上均取得了良好的
→
PDF
2 years ago
Prev
Next