关键词audiovisual
搜索结果 - 8
- AV-CrossNet: 一种用于语音分离的音视频复杂频谱映射网络,利用窄频和交叉频带建模PDF17 days ago
- CVPRAVFormer: 为冻结的语音模型注入视觉信息以实现零样本 AV-ASRPDFa year ago
- 音视频交叉模态检索中标签空间的完整三元组损失PDF2 years ago
- 一种基于虚拟现实的音视调语知觉检测方法PDF2 years ago
- ¡ 太神奇了!西班牙语中的多模式讽刺检测:数据集和基线PDF3 years ago
- CVPR自我监督多模态知识蒸馏:利用声音进行多物体检测与跟踪PDF3 years ago
- CVPRSTAViS: 时空音视频显著性网络PDF4 years ago
- ACL多模态讽刺检测(一篇_显然_完美的论文)PDF5 years ago
Prev
Next