BriefGPT.xyz
Ask
alpha
关键词
localization maps
搜索结果 - 3
CLIP 能帮助声源定位吗?
利用大规模预训练的图像 - 文本模型对声源定位进行了扩展,通过音频信号与图像的对应关系,生成音频驱动的嵌入向量,以此对提供的音频生成驱动遮罩,并提取高亮区域的音频驱动图像特征,并与音频驱动的嵌入向量进行对齐,实现声音对象的更完整和更紧凑的定
→
PDF
8 months ago
CVPR
自监督图像特定原型探索用于弱监督语义分割
提出了一种基于自我监督的图像特定原型探索的弱监督语义分割方法,结合图像特定的类别激活映射和一致性损失,实现完整的区域捕捉和特征表示,取得了 PASCAL VOC 2012 和 MS COCO 2014 分割基准数据集上的最新的最佳表现,只需
→
PDF
2 years ago
CVPR
FickleNet: 弱监督和半监督语义图像分割基于随机推理
FickleNet 提出了一种基于神经网络的图像语义分割方法,通过随机的方式得到激活值,自适应地学习特征图上每个位置的相关性,从而得到既包含物体区分度,又准确的定位边界的 localization maps。该方法无需另行训练,并仅通过添加
→
PDF
5 years ago
Prev
Next