关键词cross-modal representation
搜索结果 - 7
- ACLCIF-PT:通过连续的集成和火预训练将语音和文本表示桥接到口语语言理解中PDFa year ago
- UniAdapter:跨模态建模的统一参数高效迁移学习PDFa year ago
- ECCVCODER: 用于图像 - 文本检索的耦合多样性感知动量对比学习PDF2 years ago
- MM利用显式高层语义提升视频文本检索PDF2 years ago
- CVPR定位并分割:一个强大的指示物图像分割流水线PDF3 years ago
- MM视频中时间语言定位的细粒度迭代注意力网络PDF4 years ago
- 学习面孔和声音的关联PDF6 years ago
Prev
Next