BriefGPT.xyz
Ask
alpha
关键词
audio-visual source separation
搜索结果 - 2
DAVIS: 高质量的音频视觉分离与生成扩散模型
我们提出了 DAVIS,一种基于扩散模型的音频 - 视觉分离框架,通过生成的方式解决音频 - 视觉声源分离任务。与现有的判别方法相比,DAVIS 利用生成性扩散模型和 Separation U-Net 从高斯噪声开始合成分离后的幅度,以实现
→
PDF
a year ago
基于乐器标签的端到端声源分离
本研究提出一种扩展的 Wave-U-Net 模型,通过可变数量源的端到端音乐源分离方法,并在瓶颈处使用仪器标签进行乘性调节,从而提高了分离结果,在此基础上实现了其他类型的调节,如音视频源分离和得分通知源分离。
PDF
6 years ago
Prev
Next