关键词multimodal training
搜索结果 - 8
- PIN:一种适用于配对和交错多模态文档的知识密集数据集PDF16 days ago
- JEP-KD:基于联合嵌入预测架构的知识蒸馏用于视觉语音识别PDF4 months ago
- 4M:大规模多模态蒙版建模PDF7 months ago
- 多模态 Transformer 改进单模态推理PDF8 months ago
- 在大型语言模型中种下一个愿景的种子PDFa year ago
- 如何将预训练的视觉语言模型改编为仅文本输入模式?PDF2 years ago
- 基于骨架的动作识别语言监督训练PDF2 years ago
- EMNLP章鱼的世界:报道偏见如何影响语言模型对颜色的感知PDF3 years ago
Prev
Next