BriefGPT.xyz
大模型
Ask
alpha
关键词
davis
搜索结果 - 2
DAVIS: 高质量的音频视觉分离与生成扩散模型
我们提出了 DAVIS,一种基于扩散模型的音频 - 视觉分离框架,通过生成的方式解决音频 - 视觉声源分离任务。与现有的判别方法相比,DAVIS 利用生成性扩散模型和 Separation U-Net 从高斯噪声开始合成分离后的幅度,以实现
→
PDF
a year ago
ICCV
视频对象分割的学习实例传播(Learning Instance Propagation for Video Object Segmentation)
本研究提出了一种端到端的深度神经网络,结合了 Mask-RCNN 实例分割网络和 Conv-GRU 视觉记忆模块,用于解决半监督视频对象分割任务,实验结果表明该方法在 DAVIS 数据集上取得了令人满意的结果。
PDF
5 years ago
Prev
Next