BriefGPT.xyz
大模型
Ask
alpha
关键词
speechclip
搜索结果 - 2
SpeechCLIP+: 自我监督多任务表示学习:用于语音的 CLIP 和语音 - 图像数据
通过替换固定数量的 CLS 令牌,基于 Continuous Integrate-and-Fire 模块的级联 SpeechCLIP 模型在语音关键词提取任务中优于之前的级联 SpeechCLIP 模型。此外,通过混合架构,级联任务学习提升
→
PDF
5 months ago
SpeechCLIP:将语音与预训练的视觉和语言模型相融合
本文提出了一种名为 SpeechCLIP 的新框架,通过图像将语音和文本结合起来,从而改善语音模型的性能,无需直接从转录中进行监督。SpeechCLIP 使用先进的预训练 HuBERT 和 CLIP 模型,并通过配对的图像和口头字幕进行对齐
→
PDF
2 years ago
Prev
Next