BriefGPT.xyz
大模型
Ask
alpha
关键词
audio-visual recognition
搜索结果 - 1
基于 3D 卷积神经网络的跨模态音视频匹配识别
本文提出了一种利用耦合三维卷积神经网络架构来映射音频和视频流到统一表示空间,从而有效地找到不同模态之间时间信息的关联性的 AVR 方法,并且相对于现有的采用 3D CNN 特征表示的视听匹配方法,使用较小的网络架构和数据集进行训练,我们的方
→
PDF
7 years ago
Prev
Next