关键词multimodal features
搜索结果 - 17
- CVPRMA-AVT:用于参数高效音频 - 视觉变换器的模态对齐PDF25 days ago
- 跨领域音视频欺诈检测的基准测试PDF2 months ago
- 多模态推荐的对齐和训练框架PDF3 months ago
- 唱出电子身体:机器人具象对用户期望的影响PDF6 months ago
- WSDMMONET: 多模态图卷积网络和目标感知注意力在多媒体推荐中的应用PDF7 months ago
- ICCV基于图像文本相似度和标题修改的数据比赛挑战:过滤轨道和自带设备轨道的利用PDF8 months ago
- 看见和听见未被表达的内容:一种多模式客户行为分类器在激励性面谈中的可解释性融合PDF9 months ago
- DiffCap:探索连续扩散在图像字幕生成中的应用PDFa year ago
- 视频中多模态特征提取和基于注意力的融合情绪估计PDFa year ago
- CVPR基于 Transformer 的视频情感反应强度估计和表达分类的多模态特征提取与融合PDFa year ago
- MM使用不对称多层融合学习深层次多模态特征表示PDF3 years ago
- IJCAIUIBert:为界面理解学习通用多模态表示PDF3 years ago
- 深度视频修复检测PDF3 years ago
- WWW对抗式多模态表征学习用于点击率预测PDF4 years ago
- AAAI基于反应式多阶段特征融合的多模态对话建模PDF5 years ago
- 基于 3D 卷积神经网络的跨模态音视频匹配识别PDF7 years ago
- 深度视频中的多模态多部分学习与动作识别PDF9 years ago
Prev
Next