关键词cross-modal pre-training
搜索结果 - 5
- ICCVGrowCLIP: 面向大规模对比式语言图像预训练的数据感知自动模型扩展PDF10 months ago
- AAAINLIP: 噪声鲁棒性语言 - 图像预训练PDF2 years ago
- EMNLPSpeechUT:基于编码器 - 解码器的语音 - 文本预训练中隐藏单元的桥接PDF2 years ago
- 对比交叉模态知识共享预训练用于视觉语言表示学习和检索PDF2 years ago
- AAAIUnicoder-VL: 一个视觉语言通用编码器,通过交叉模态预训练实现PDF5 years ago
Prev
Next