BriefGPT.xyz
Ask
alpha
关键词
pixelwise segmentation masks
搜索结果 - 1
无需注释的音视频分割
本文提出了一种用于定位视觉场景中声音对象的 Audio-Visual Segmentation (AVS) 的方法,其中使用了缩放和无注释的管道来生成 AVS 模型的合成数据,还提出了一种 Audio-Aware Transformer (
→
PDF
a year ago
Prev
Next