关键词cross-modal transformer
搜索结果 - 8
  • 融合镁冶炼过程中的异常检测的跨模态学习:方法论和基准
    PDF23 days ago
  • TM2D: 基于双模态驱动的音乐文本融合三维舞蹈生成
    PDFa year ago
  • 基于草图的视频物体定位
    PDFa year ago
  • ECCVLevenshtein OCR
    PDF2 years ago
  • MM用于压缩视频物体指代分割的多注意力网络
    PDF2 years ago
  • ReLER@ZJU-Alibaba 参加 Ego4D 自然语言查询竞赛 2022
    PDF2 years ago
  • CTAL:跨模态预训练 Transformer 用于音频和语言表示
    PDF3 years ago
  • EMNLPHERO: 视频 + 语言全方位表示的分层编码器预训练
    PDF4 years ago
Prev
Next