BriefGPT.xyz
Ask
alpha
关键词
audio-visual localization
搜索结果 - 2
AAAI
声音提示分割是可推广的音频 - 视觉源定位器
通过引入编码 - 提示 - 解码范式,本研究关注零样本和少样本情景下的视听定位和分割任务,并通过构建语义感知的音频提示和相关适配器,实现了在数据稀缺和数据分布差异方面的优越性能。
PDF
10 months ago
AV-SAM: 模型将任何物体分割与视听定位相结合
本文提出了基于 SAM 模型的简单而有效的音频 - 视觉定位和分割框架 AV-SAM,可以生成对应于音频的听觉对象掩模,实现像声音定位和分割等视听任务。
PDF
a year ago
Prev
Next