BriefGPT.xyz
Ask
alpha
关键词
cross-modal music video retrieval
搜索结果 - 1
通过受监督的深度 CCA 实现跨模式音乐视频检索的音频 - 视觉嵌入
使用 S-DCCA 算法构建跨模态音乐视频检索模型,其中采用基于 Attention 机制 LSTM 模型选择 top k 音频块,使得得到的局部音频摘要能够很好地代表整个音频内容,构建的深度学习模型实现了音频和视频语义的跨模态学习,从而实
→
PDF
5 years ago
Prev
Next