关键词multimodal training
搜索结果 - 8
  • PIN:一种适用于配对和交错多模态文档的知识密集数据集
    PDF16 days ago
  • JEP-KD:基于联合嵌入预测架构的知识蒸馏用于视觉语音识别
    PDF4 months ago
  • 4M:大规模多模态蒙版建模
    PDF7 months ago
  • 多模态 Transformer 改进单模态推理
    PDF8 months ago
  • 在大型语言模型中种下一个愿景的种子
    PDFa year ago
  • 如何将预训练的视觉语言模型改编为仅文本输入模式?
    PDF2 years ago
  • 基于骨架的动作识别语言监督训练
    PDF2 years ago
  • EMNLP章鱼的世界:报道偏见如何影响语言模型对颜色的感知
    PDF3 years ago
Prev
Next