关键词cross-modal transformer
搜索结果 - 8
- 融合镁冶炼过程中的异常检测的跨模态学习:方法论和基准PDF23 days ago
- TM2D: 基于双模态驱动的音乐文本融合三维舞蹈生成PDFa year ago
- 基于草图的视频物体定位PDFa year ago
- ECCVLevenshtein OCRPDF2 years ago
- MM用于压缩视频物体指代分割的多注意力网络PDF2 years ago
- ReLER@ZJU-Alibaba 参加 Ego4D 自然语言查询竞赛 2022PDF2 years ago
- CTAL:跨模态预训练 Transformer 用于音频和语言表示PDF3 years ago
- EMNLPHERO: 视频 + 语言全方位表示的分层编码器预训练PDF4 years ago
Prev
Next