关键词cross-modal tasks
搜索结果 - 6
- Zipper:融合多模式的多塔解码器架构PDF17 days ago
- CVPR正向增量对比学习在图像和视频字幕评估中的应用PDFa year ago
- 一种分子多模基础模型,将分子图与自然语言相关联PDF2 years ago
- ACLUNIMO-2: 端到端的统一视觉语言基础学习PDF2 years ago
- ICMLOFA: 通过一个简单的序列到序列学习框架统一架构、任务和模态PDF2 years ago
- AAAI通过场景图增强知识的视觉 - 语言表示:ERNIE-ViLPDF4 years ago
Prev
Next