关键词cross-modal contrastive learning
搜索结果 - 17
- 视觉语言与骨骼的融合:逐步蒸馏和跨模态知识用于 3D 动作表示学习PDFa month ago
- CrossVideo: 点云视频理解的自监督跨模态对比学习PDF5 months ago
- AstroCLIP:天体基础模型的跨模态预训练PDF9 months ago
- ACL利用伪造的图像标题进行多模态摘要PDFa year ago
- 通过交叉模态相似度调节的对比学习进行视觉语言预训练PDFa year ago
- 动词在行动:提高视频语言模型中动词理解能力PDFa year ago
- 看似相似,听起来不同:利用反事实的跨模态样本进行视听表示学习PDFa year ago
- CVPRCLIP2Scene: 基于 CLIP 的高效场景理解PDFa year ago
- EMNLP文本 - 视频检索的标准化对比学习PDF2 years ago
- EMNLP跨模态对齐的低资源神经机器翻译PDF2 years ago
- MM视频指称理解中的对话问题PDF2 years ago
- 基于图像级别分类和去偏置交叉模态对比学习的开放词汇三维检测PDF2 years ago
- 重新思考音频 - 视觉同步以进行活动演讲者检测PDF2 years ago
- 基于属性信息嵌入和跨模态对比学习的微表情识别PDF2 years ago
- ACL跨模态对比学习用于语音翻译PDF2 years ago
- CVPR稳健的跨模态表示学习与渐进式自蒸馏PDF2 years ago
- ACLUNIMO:通过跨模态对比学习实现统一模态理解和生成PDF4 years ago
Prev
Next