关键词multimodal features
搜索结果 - 17
  • CVPRMA-AVT:用于参数高效音频 - 视觉变换器的模态对齐
    PDF25 days ago
  • 跨领域音视频欺诈检测的基准测试
    PDF2 months ago
  • 多模态推荐的对齐和训练框架
    PDF3 months ago
  • 唱出电子身体:机器人具象对用户期望的影响
    PDF6 months ago
  • WSDMMONET: 多模态图卷积网络和目标感知注意力在多媒体推荐中的应用
    PDF7 months ago
  • ICCV基于图像文本相似度和标题修改的数据比赛挑战:过滤轨道和自带设备轨道的利用
    PDF8 months ago
  • 看见和听见未被表达的内容:一种多模式客户行为分类器在激励性面谈中的可解释性融合
    PDF9 months ago
  • DiffCap:探索连续扩散在图像字幕生成中的应用
    PDFa year ago
  • 视频中多模态特征提取和基于注意力的融合情绪估计
    PDFa year ago
  • CVPR基于 Transformer 的视频情感反应强度估计和表达分类的多模态特征提取与融合
    PDFa year ago
  • MM使用不对称多层融合学习深层次多模态特征表示
    PDF3 years ago
  • IJCAIUIBert:为界面理解学习通用多模态表示
    PDF3 years ago
  • 深度视频修复检测
    PDF3 years ago
  • WWW对抗式多模态表征学习用于点击率预测
    PDF4 years ago
  • AAAI基于反应式多阶段特征融合的多模态对话建模
    PDF5 years ago
  • 基于 3D 卷积神经网络的跨模态音视频匹配识别
    PDF7 years ago
  • 深度视频中的多模态多部分学习与动作识别
    PDF9 years ago
Prev
Next